Навигация по странице:
|
Контрольная_работа. Контрольная работа по курсу "Основы инфокоммуникационных технологий" Вариант 08 Выполнил студентка Группа мбв72
Сибирский Государственный Университет Телекоммуникаций и Информатики
Межрегиональный центр переподготовки специалистов
Контрольная работа
по курсу "Основы инфокоммуникационных технологий"
Вариант 08
Выполнил: студентка
Группа: МБВ-72
Проверил:
2017
Вариант 8
Электросвязь – это …
Электросвязь – это разновидность связи, при которой передача или прием любого вида информации (знаки, сигналы, голос/речь, текст, изображение, звуки и т.д.) осуществляется электромагнитными сигналами, распространяющимися по проводам, радио, волоконно-оптическому кабелю, либо другим электромагнитным системам.
Принцип электросвязи
Принцип электросвязи – основан на преобразовании сигналов сообщения в первичные электрические сигналы. В свою очередь первичные электрические сигналы при помощи передатчика преобразуются во вторичные электрические сигналы, характеристики которых хорошо согласуются с характеристиками линии связи. Далее посредством линии связи вторичные сигналы поступают на вход приемника. В приемном устройстве вторичные сигналы обратно преобразуются в сигналы сообщения.
Виды электросвязи.
По виду передачи информации все современные системы электросвязи условно классифицируются на предназначенные для передачи звука, видео, текста.
В зависимости от среды передачи выделяют электрическую, оптическую и радио- связь.
В зависимости от назначения сообщений виды электросвязи могут быть квалифицированы на предназначенные для передачи информации индивидуального и массового характера. Так же, по временным параметрам виды электросвязи могут быть предназначены для работы в реальном времени или осуществляющие отложенную доставку сообщений.
К первичным электрическим сигналам относятся: телеграфные, факсимильные сигналы, сигналы передачи данных, сигналы телевизионного и звукового вещания, сигналы телеконтроля и телеуправления.
Телеграфная связь - коммутируемая система связи, при которой сообщение набирается и посимвольно передается принимающей стороне, где синхронно получается распечатка (телеграмма). Телефонная связь - вид электросвязи, предназначенный для обмена информацией преимущественно путем разговора с использованием телефонных аппаратов.
Фототелеграфная связь - факсимильная связь, при которой регистрация принимаемых изображений осуществляется фотографическими методами.
Факсимильная связь - передача по телефонным каналам с помощью специального аппарата (телефакса) неподвижных изображений и текста, выполненных на бумажном носителе.
Телевещание - передача сообщений и других информационных программ по телевидению.
Передача данных - в широком смысле - процесс передачи данных по каналу связи от источника к приемнику. Различают синхронную и асинхронную передачу данных. Синхронная передача данных - передача данных, базирующаяся на согласовании таймеров передающего и принимающего устройств. При этом биты передаются кадрами. Для начала синхронизации и периодической проверки ее точности используются специальные символы. Передача прекращается по окончании блока и начинается при поступлении нового блока. Асинхронная передача данных - передача данных, при которой интервалы времени между направляемыми блоками данных не являются постоянными. Для выделения в потоке данных блоков в начале и конце каждого из них записываются, старт/стопные биты. При асинхронной передаче передатчик и приемник данных работают не зависимо друг от друга.
Передача данных - в телефонной связи - обмен данными любого характера между абонентскими устройствами, оборудованными для передачи данных по телефонной сети. Коммутируемая мультимегабитная передача данных - высокоскоростная служба глобальных сетей, в которой каждый пакет в многопакетной передаче адресуется индивидуально.
Телерукопись - служба передачи графической информации, которая отображается на приемном конце согласно движениям "пера", пишущего на передающем конце. Сообщения, которые могут представлять собой рукописный текст, рисунки, чертежи и т.п., наносятся отправителем на бумагу, лежащую на специальном планшете. На приемном конце сообщения воспроизводятся на бумаге или чаще всего - на экране дисплея. Во многих случаях телерукопись дополняет телефонную службу. При этом письменные сообщения передаются по телефонному каналу со скоростью 300 бит/с. Эта служба представляет особенно большой интерес для глухих и немых пользователей. Видеотелефонная связь - двусторонняя связь для передачи изображения и речи по одному телевизионному и двум телефонным каналам связи. Радиовещание («радио» + «вещать», то есть сообщать) - технология передачи звуковой информации в эфире, проводных сетях (проводное радиовещание) или в сетях с пакетной коммутацией (в компьютерных сетях - интернет-радио). Характеризуется передачей сигнала по принципу «от одного - ко многим», т.е более чем одному слушателю, как правило - по заранее известному расписанию. Разновидность радиовещания - спутниковое радиовещание. Это радиовещание с использованием искусственных спутников Земли (ИСЗ). Аудиоконференция – это процесс использования электронных каналов связи для организации совещаний между тремя и более участниками, при котором происходит голосовая коммутация (соединение) участников конференции. У каждой конференции есть координатор (ведущий конференции), который управляет ей и следит за тем, чтобы не нарушалась тематика конференции, этикет и т.п.
Видеоконференция - это вид групповых телекоммуникаций, который позволяет группе людей из 3 и более человек видеть и слышать друг друга, а так же обмениваться данными с персонального компьютера (передача данных), независимо от разделяющего их расстояния. Для организации видеоконференций используется технология - видеоконференцсвязь. Общение в режиме видеоконференций также называют сеансом видеоконференцсвязи. Видеоконференция применяется как средство общения для сокращения командировочных расходов в территориально распределенных организациях, а также как один из элементов технологий телемедицины и дистанционного обучения. Исследования ученых показали, что если к общению собеседников по звуковому (аудиальному) каналу добавляется визуальный невербальный язык (жесты, мимика и т.п), то у собеседников повышается эффективность восприятия информации. Видеоконференции часто сопровождаются передачей данных. Передача данных - это особый термин в видеоконференции и видеосвязи. Он означает интерактивный показ компьютерной информации параллельно со звуком и видео в том же канале.
Видеоконференцсвязь (ВКС) - телекоммуникационная технология, обеспечивающая организацию видеоконференций между двумя и более точками по сети передачи данных. Во время Сеанса ВКС обеспечивается интерактивный обмен звуком, изображением и "контентом" (передача данных). Для общения в режиме видеоконференции абонент должен иметь терминал ВКС. Обычно Терминал ВКС состоит из микрофона, видеокамеры, устройств отображения информации и воспроизведения звука, а также центрального устройства - кодека, обеспечивающего кодирование/декодирование аудио и видео информации, захват и отображение контента. В качестве кодека может использоваться компьютер с программным обеспечением или программно-аппаратный комплекс. Для подключения к сети передачи данных используются протоколы IP или ISDN. Служба обработки сообщений (электронная почта) предоставляет пользователям возможность передачи сообщений через промежуточные накопители (метод коммутации сообщений). В системе электронной почты терминалы отправителя и получателя могут быть разного типа. Система обеспечивает необходимые преобразования. Сообщения передаются и принимаются автоматически. Электронная почта выполняет ряд функций секретаря абонента - сортировка принятых сообщений, просмотр очереди подготовленных к отправке сообщений. Служба предоставляет возможность контроля за прохождением сообщения. Важной услугой электронной почты является защита сообщений от НСД, обеспечение целостности информации, сохранение ее конфиденциальности, аутентификация пользователей.
Перечислите услуги электросвязи, которые Вы знаете?
Услуги телефонной связи;
Услуги телеграфной связи;
Услуги факсимильной связи;
Услуги теле/радио вещания (телевидение и радио);
Услуги аудио и видео конференций;
Аренда каналов связи;
Услуги доступа Интернет;
IP – телефония;
Услуги кабельного телевидения;
Предоставление услуг хранения информации и обработки запросов пользователей об адресах, телефонах юридических и физических лиц и другой информации посредством сетей и служб связи общего пользования;
Услуги электронной почты
И т.д….
Информация, виды и свойства информации.
Информация – сведения или знания о чем-либо; знания, которые можно собрать, хранить, передать, обработать и использовать.
Информация – отражение окружающего мира посредством сигналов и знаков. Ценность информационного сообщения заключается в новых знаниях, которые содержатся в нем.
Виды информации
Информация может существовать в различных видах: текст, рисунки, чертежи, фотографии; световые или звуковые сигналы; радиоволны; электрические и нервные импульсы; магнитные записи; жесты и мимика; запахи и вкусовые ощущения; хромосомы, через которые передаются по наследству признаки и свойства организмов, и т. д.
Различают основные виды информации, которые классифицируют по ее форме представления, способам ее кодирования и хранения:
графическая – один из древнейших видов, с помощью которого хранили информацию об окружающем мире в виде наскальных рисунков, а затем в виде картин, фотографий, схем, чертежей на различных материалах (бумага, холст, мрамор и др.), которые изображают картины реального мира;
звуковая (акустическая) – для хранения звуковой информации в 1877 г. было изобретено звукозаписывающее устройство, а для музыкальной информации – разработан способ кодирования с использованием специальных символов, который дает возможность хранить ее как графическую информацию;
текстовая – кодирует речь человека с помощью специальных символов – букв (для каждого народа свои); для хранения используется бумага (записи в тетради, книгопечатание и т.п.);
числовая – кодирует количественную меру объектов и их свойств в окружающем мире с помощью специальных символов – цифр (для каждой системы кодирования свои); особенно важной стала с развитием торговли, экономики и денежного обмена; видеоинформация – способ хранения «живых» картин окружающего мира, который появился с изобретением кино.
Существуют также виды информации, для которых еще не изобретены способы кодирования и хранения – тактильная информация, органолептическая и др.
Первоначально информация передавалась на большие расстояния с помощью кодированных световых сигналов, после изобретения электричества – передачи закодированного определенным образом сигнала по проводам, позже – используя радиоволны.
Свойства информации:
Объективность. Объективная информация – существующая независимо от человеческого сознания, методов ее фиксации, чьего-либо мнения или отношения.
Достоверность. Информация, отражающая истинное положение дел, является достоверной. Недостоверная информация чаще всего приводит к неправильному пониманию или принятию неправильных решений. Устаревание информации может из достоверной информации сделать недостоверную, т.к. она уже не будет отражением истинного положения дел.
Полнота. Информация является полной, если она достаточна для понимания и принятия решений. Неполная или избыточная информация может привести к задержке принятия решения или к ошибке.
Точность информации – степень ее близости к реальному состоянию объекта, процесса, явления и т. п.
Ценность информации зависит от ее важности для принятия решения, решения задачи и дальнейшей применимости в каких-либо видах деятельности человека.
Актуальность. Только своевременность получения информации может привести к ожидаемому результату.
Понятность. Если ценную и своевременную информацию выразить непонятно, то она, скорее всего, станет бесполезной. Информация будет понятной, когда она, как минимум, выражена понятным для получателя языком.
Доступность. Информация должна соответствовать уровню восприятия получателя. Например, одни и те же вопросы по-разному излагаются в учебниках для школы и вуза.
Краткость. Информация воспринимается гораздо лучше, если она представлена не подробно и многословно, а с допустимой степенью сжатости, без лишних деталей. Краткость информации незаменима в справочниках, энциклопедиях, инструкциях. Логичность, компактность, удобная форма представления облегчает понимание и усвоение информации.
Хранение информации.
Хранение информации является информационным процессом, в ходе которого информация остается неизменной во времени и пространстве.
Хранение информации не может осуществляться без физического носителя.
Когда информации, окружающей человека, стало очень много, и он оказался не в силах ее запомнить, возникла письменность. Со временем она совершенствовалась и превратилась в неотъемлемую часть повседневной жизни человека. Однако большое количество бумажных носителей затрудняет быстрый поиск нужной информации, а с появлением цифровой информации и средств для ее преобразования и хранения появилась возможность по-другому посмотреть на данную проблему.
Цифровая информация имеет ряд преимуществ, связанных с устойчивостью к помехам при передаче и более продолжительным сроком хранения.
Хранение информации – это один из главных информационных процессов, с которым неразрывно связано понятие устройства хранения информации, или запоминающего устройства. Разные устройства могут использовать различные способы хранения информации. Совокупность таких устройств называют памятью. Чаще понятие «хранение информации» связывают с компьютерной техникой. Память компьютера бывает внутренней и внешней. К внутренней памяти относятся устройства, обеспечивающие работоспособность самой вычислительной системы (компьютера). Например, оперативная память, кэш-память. Большинство запоминающих устройств, известных рядовому пользователю, таких как винчестер, USB-флеш, карта памяти, компакт-диск, относятся к внешней памяти. До недавнего времени это было единственным, что могла предложить нам компьютерная индустрия. Теперь у любого есть возможность хранить свою личную информацию прямо в сети Интернет, причем, даже не тратя на это деньги. С одной стороны, это очень удобно, так как с любого устройства, имеющего подключение к сети Интернет, можно получить доступ и просмотреть необходимую информацию. Таким образом, исключаются случаи, когда флешка с информацией забыта дома, как раз в тот день, когда она была очень нужна на работе.
Хранение информации сопровождается одним неприятным моментом, связанным с ее порчей, потерей или несанкционированным доступом. Любой опытный пользователь знает несколько приемов, как обезопасить свою информацию от потерь. Например, не следует хранить ценную информацию на винчестере, так как велика вероятность «подхватить» вирус, который все уничтожит. Также можно дублировать важную информацию сразу на несколько носителей. Такую информацию обычно хранят на съемных запоминающих устройствах, для которых создаются определенные условия хранения. Но существует еще один способ, обеспечивающий надежное хранение информации. Это использование «облачных» Интернет-сервисов, в таком случае информация пользователя хранится на распределенных серверах сети Интернет, а доступ к ней осуществляется посредством логина и пароля. У такой технологии союзников и противников примерно поровну. Некоторые вообще не доверяют глобальной сети свои личные файлы, а другие, наоборот, видят в этом будущее. В современном мире, особенно в крупных городах, где доступ к глобальной сети есть повсеместно, такое хранение информации выглядит предпочтительным. Не требуется покупать, обслуживать и дрожать над сохранностью фотографий или видеоархива.
Передача информации.
Распространение информации происходит в процессе ее передачи.
При передаче информации всегда есть два объекта – источник и приемник информации. Эти роли могут меняться, например, во время диалога каждый из участников выступает то в роли источника, то в роли приемника информации.
Информация проходит от источника к приемнику через канал связи, в котором она должна быть связана с каким-то материальным носителем. Для передачи информации свойства этого носителя должны изменяться со временем. Так лампочка, которая все время горит, передает информацию только о том, что какой-то процесс идет. Если же включать и выключать лампочку, можно передавать самую разную информацию, например, с помощью азбуки Морзе.
При разговоре людей носитель информации – это звуковые волны в воздухе. В компьютерах информация передается с помощью электрических сигналов или радиоволн (в беспроводных устройствах). Информация может передаваться с помощью света, лазерного луча, системы телефонной или почтовой связи, компьютерной сети и др.
Информация поступает по каналу связи в виде сигналов, которые приемник может обнаружить с помощью своих органов чувств (или датчиков) и «понять» (раскодировать).
Сигнал– это изменение свойств носителя, которое используется для передачи информации.
Примеры сигналов – это изменение частоты и громкости звука, вспышки света, изменение напряжения на контактах и т.п.
Человек может принимать сигналы только с помощью своих органов чувств. Чтобы передавать информацию, например, с помощью радиоволн, нужны вспомогательные устройства: радиопередатчик, преобразующий звук в радиоволны, и радиоприемник, выполняющий обратное преобразование. Они позволяют расширить возможности человека.
С помощью одного сигнала невозможно передать много информации. Поэтому чаще всего используется не одиночный сигнал, а последовательность сигналов, то есть сообщение.Важно понимать, что сообщение – это только «оболочка» для передачи информации, а информация – это содержание сообщения. Приемник должен сам «извлечь» информацию из полученной последовательности сигналов. Можно принять сообщение, но не принять информацию, например, услышав речь на незнакомом языке или перехватив шифровку.
Одна и та же информация может быть передана с помощью разных сообщений, например, через устную речь, с помощью записки или с помощью флажного семафора, который используется на флоте. В то же время одно и то же сообщение может нести разную информацию для разных приемников. Так фраза «В Сантьяго идет дождь», переданная в 1973 году на военных радиочастотах, для сторонников генерала А. Пиночета послужила сигналом к началу государственного переворота в Чили.
Таким образом, информация представляется и передается в форме последовательности сигналов, символов. От источника к приёмнику сообщение передается через некоторую материальную среду. Если в процессе передачи используются технические средства связи, то их называют каналами передачи информации (информационными каналами). К ним относятся телефон, радио, ТВ. Органы чувств человека исполняют роль биологических информационных каналов.
Процесс передачи информации по техническим каналам связи проходит по следующей схеме (по Шеннону):
Передача информации возможна с помощью любого языка кодирования информации, понятного как источнику, так и приёмнику.
Кодирующее устройство – устройство, предназначенное для преобразования исходного сообщения источника информации к виду, удобному для передачи.
Декодирующее устройство – устройство для преобразования кодированного сообщения в исходное.
Пример. При телефонном разговоре: источник сообщения – говорящий человек; кодирующее устройство – микрофон – преобразует звуки слов (акустические волны) в электрические импульсы; канал связи – телефонная сеть (провод); декодирующее устройство – та часть трубки, которую мы подносим к уху, здесь электрические сигналы снова преобразуются в слышимые нами звуки; приёмник информации – слушающий человек.
Термином «шум» называют разного рода помехи, искажающие передаваемый сигнал и приводящие к потере информации. Такие помехи, прежде всего, возникают по техническим причинам: плохое качество линий связи, незащищенность друг от друга различных потоков информации, передаваемой по одним и тем же каналам. Для защиты от шума применяются разные способы, например, применение разного рода фильтров, отделяющих полезный сигнал от шума. Существует наука, разрабатывающая способы защиты информации – криптология, широко применяющаяся в теории связи.
Клодом Шенноном была разработана специальная теория кодирования, дающая методы борьбы с шумом. Одна из важных идей этой теории состоит в том, что передаваемый по линии связи код должен быть избыточным. За счет этого потеря какой-то части информации при передаче может быть компенсирована. Однако нельзя делать избыточность слишком большой. Это приведёт к задержкам и подорожанию связи. Иными словами, чтобы содержание сообщения, искаженного помехами, можно было восстановить, оно должно быть избыточным, то есть, в нем должны быть «лишние» элементы, без которых смысл все равно восстанавливается. Например, в сообщении «Влг впдт в Кспск мр» многие угадают фразу «Волга впадает в Каспийское море», из которой убрали все гласные. Этот пример говорит о том, что естественные языки содержат много «лишнего», их избыточность оценивается в 60-80%.
При обсуждении темы об измерении скорости передачи информации можно привлечь прием аналогии. Аналог – процесс перекачки воды по водопроводным трубам. Здесь каналом передачи воды являются трубы. Интенсивность (скорость) этого процесса характеризуется расходом воды, т.е. количеством литров, перекачиваемых за единицу времени. В процессе передачи информации каналами являются технические линии связи. По аналогии с водопроводом можно говорить об информационном потоке, передаваемом по каналам. Скорость передачи информации – это информационный объем сообщения, передаваемого в единицу времени. Поэтому единицы измерения скорости информационного потока: бит/с, байт/с и др.
Еще одно понятие – пропускная способность информационных каналов – тоже может быть объяснено с помощью «водопроводной» аналогии. Увеличить расход воды через трубы можно путем увеличения давления. Но этот путь не бесконечен. При слишком большом давлении трубу может разорвать. Поэтому предельный расход воды, который можно назвать пропускной способностью водопровода. Аналогичный предел скорости передачи данных имеют и технические линии информационной связи. Причины этому также носят физический характер.
Обработка информации.
Обработка информации состоит в получении одних «информационных объектов» из других «информационных объектов» путем выполнения некоторых алгоритмов и является одной из основных операций, осуществляемых над информацией, и главным средством увеличения ее объема и разнообразия.
На самом верхнем уровне можно выделить числовую и нечисловую обработку. В указанные виды обработки вкладывается различная трактовка содержания понятия «данные». При числовой обработке используются такие объекты, как переменные, векторы, матрицы, многомерные массивы, константы и т.д. При нечисловой обработке объектами могут быть файлы, записи, поля, иерархии, сети, отношения и т.д. Другое отличие заключается в том, что при числовой обработке содержание данных не имеет большого значения, в то время как при нечисловой обработке нас интересуют непосредственные сведения об объектах, а не их совокупность в целом.
С точки зрения реализации на основе современных достижений вычислительной техники выделяют следующие виды обработки информации:
• последовательная обработка, применяемая в традиционной фоннеймановской архитектуре ЭВМ, располагающей одним процессором;
• параллельная обработка, применяемая при наличии нескольких процессоров в ЭВМ;
• конвейерная обработка, связанная с использованием в архитектуре ЭВМ одних и тех же ресурсов для решения разных задач, причем если эти задачи тождественны, то это последовательный конвейер, если задачи одинаковые – векторный конвейер.
Принято относить существующие архитектуры ЭВМ с точки зрения обработки информации к одному из следующих классов.
Архитектуры с одиночным потоком команд и данных (SISD). К этому классу относятся традиционные однопроцессорные системы, где имеется центральный процессор, работающий с парами «атрибут – значение».
Архитектуры с одиночными потоками команд и данных (SIMD). Особенностью данного класса является наличие одного (центрального) контроллера, управляющего рядом одинаковых процессоров. В зависимости от возможностей контроллера и процессорных элементов, числа процессоров, организации режима поиска и характеристик маршрутных и выравнивающих сетей выделяют:
• матричные процессоры, используемые для решения векторных и матричных задач;
• ассоциативные процессоры, применяемые для решения нечисловых задач и использующие память, в которой можно обращаться непосредственно к информации, хранящейся в ней;
• процессорные ансамбли, применяемые для числовой и нечисловой обработки;
• конвейерные и векторные процессоры.
Архитектуры с множественным потоком команд и одиночным потоком данных (MISD). К этому классу могут быть отнесены конвейерные процессоры.
Архитектуры с множественным потоком команд и множественным потоком данных (MIMD). К этому классу могут быть отнесены следующие конфигурации: мультипроцессорные системы, системы с мультобработкой, вычислительные системы из многих машин, вычислительные сети.
Основные процедуры обработки данных представлены на рисунке.
Создание данных, как операция обработки, предусматривает их образование в результате выполнения некоторого алгоритма и дальнейшее использование для преобразований на более высоком уровне.
Модификация данных связана с отображением изменений в реальной предметной области, осуществляемых путем включения новых данных и удаления ненужных.
Обеспечение безопасности и целостности данных направлено на адекватное отображение реального состояния предметной области в информационной модели и обеспечивает защиту информации от несанкционированного доступа (безопасность) и от сбоев и повреждений технических и программных средств.
Поиск информации, хранимой в памяти компьютера, осуществляется как самостоятельное действие при выполнении ответов на различные запросы и как вспомогательная операция при обработке информации.
Поддержка принятия решений является наиболее важным действием, выполняемым при обработке информации. Широкая альтернатива принимаемых решений приводит к необходимости использования разнообразных математических моделей.
В зависимости от степени информированности о состоянии управляемого объекта, полноты и точности моделей объекта и системы управления, взаимодействия с внешней средой, процесс принятия решений протекает в различных условиях:
1) принятие решений в условиях определенности. В этой задаче модели объекта и системы управления считаются заданными, а влияние внешней среды – несущественным. Поэтому между выбранной стратегией использования ресурсов и конечным результатом существует однозначная связь, откуда следует, что в условиях определенности достаточно использовать решающее правило для оценки полезности вариантов решений, принимая в качестве оптимального то, которое приводит к наибольшему эффекту. Если таких стратегий несколько, то все они считаются эквивалентными. Для поиска решений в условиях определенности используют методы математического программирования;
2) принятие решений в условиях риска. В отличие от предыдущего случая для принятия решений в условиях риска необходимо учитывать влияние внешней среды, которое не поддается точному прогнозу, а известно только вероятностное распределение ее состояний. В этих условиях использование одной и той же стратегии может привести к различным исходам, вероятности появления которых считаются заданными или могут быть определены. Оценку и выбор стратегий проводят с помощью решающего правила, учитывающего вероятность достижения конечного результата;
3) принятие решений в условиях неопределенности. Как и в предыдущей задаче между выбором стратегии и конечным результатом отсутствует однозначная связь. Кроме того, неизвестны также значения вероятностей появления конечных результатов, которые либо не могут быть определены, либо не имеют в контексте содержательного смысла. Каждой паре «стратегия – конечный результат» соответствует некоторая внешняя оценка в виде выигрыша. Наиболее распространенным является использование критерия получения максимального гарантированного выигрыша;
4) принятие решений в условиях многокритериальности. В любой из перечисленных выше задач многокритериальность возникает в случае наличия нескольких самостоятельных, не сводимых одна к другой целей. Наличие большого числа решений усложняет оценку и выбор оптимальной стратегии. Одним из возможных путей решения является использование методов моделирования.
Создание документов, сводок, отчетов заключается в преобразовании информации в формы, пригодные для чтения как человеком, так и компьютером. С этим действием связаны и такие операции, как обработка, считывание, сканирование и сортировка документов.
При обработке информации осуществляется ее перевод из одной формы представления или существования в другую, что определяется потребностями, возникающими в процессе реализации информационных технологий.
Реализация всех действий, выполняемых в процессе обработки информации, осуществляется с помощью разнообразных программных средств.
Информационный поиск, виды и методы поиска.
Информационный поиск (ИП) (англ. Information retrieval) — процесс поиска неструктурированной документальной информации и наука об этом поиске.
Сначала системы автоматизированного ИП, или информационно-поисковые системы (ИПС), использовались лишь для управления информационным взрывом в научной литературе. Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети Интернет. У русскоязычных пользователей наибольшей популярностью пользуются поисковые системы Google, Яндекс и Рамблер.
Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех таких, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.
Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление необходимой информации заинтересованным лицам.
В общем случае поиск информации состоит из четырех этапов:
определение (уточнение) информационной потребности и формулировка информационного запроса;
определение совокупности возможных держателей информационных массивов (источников);
извлечение информации из выявленных информационных массивов;
ознакомление с полученной информацией и оценка результатов поиска.
Виды поиска
Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru, www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.
Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).
Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:
Xcavator
Retrievr
PolarRose
Picollator Online by Recogmission
Методы поиска
Адресный поиск
Процесс поиска документов по чисто формальным признакам, указанным в запросе. Для осуществления нужны следующие условия:
Наличие у документа точного адреса
Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы.
Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище.
Семантический поиск
Процесс поиска документов по их содержанию. Условия:
Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса.
Составление поискового описания, в котором указывается дополнительное условие поиска.
Принципиальная разница между адресным и семантическим поисками состоит в том, что при адресном поиске документ рассматривается как объект с точки зрения формы, а при семантическом поиске - с точки зрения содержания.
При семантическом поиске находится множество документов без указания адресов. В этом принципиальное отличие каталогов и картотек.
Библиотека - собрание библиографических записей без указания адресов.
Документальный поиск
Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.
Два вида документального поиска:
Библиотечный, направленный на нахождение первичных документов.
Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.
Фактографический поиск
Процесс поиска фактов, соответствующих информационному запросу.
К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.
Различают два вида:
Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
Фактологический (описание фактов), предпологающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.
Информационно-поисковые системы.
ИПС - это система, обеспечивающая накопление и поиск информации
ИПС, решая задачи сбора, хранения, обработки и выдачи информации, выполняют следующие операции:
поиск документов;
анализ содержимого документов;
построение поисковых образов документов (извлечение из
документов информации, используемой системой как знания
о документе);
хранение поисковых образов документов (сведений о
документах);
анализ запросов пользователей (потребителей информации);
поиск релевантных (соответствующих) запросу документов;
выдача ссылок на документы потребителям.
Это представляет возможным составить общую схему ИПС. Примером может служить типовая схема ИПС.
Индекс базы данных - это основной массив данных ИПС. Он служит для хранения сведений обо всех известных системе Интернет-документах. Данные сведения необходимы для того, чтобы поисковая система сумела найти документы на запрос пользователя.
Робот-индексировщик (crawler, spiderили паук) - программный модуль поисковой системы, служащий для поиска (отбора) информационных ресурсов в Сети и их индексирования (индексировать информацию означает приписать каждому документу ключевые слова, отражающие содержание документа и управляющие поиском, приводя к тем документам, слова которых оказываются более сходными со словами сделанного запроса), т.е. поддержания базы данных индекса в актуальном (по отношению к Интернету) состоянии. Эта программа является основным источником информации о состоянии информационных ресурсов. Просмотр документов Интернета данным модулем системы делается регулярно. Для крупных систем период просмотра документов, как правило, составляет 1-2 недели.
Общий алгоритм функционирования ИПС (принцип работы; состоит в следующем. Робот-индексировщик автоматически просматривает (переходя от одного ресурса к другому, используя ссылки, расположенные на нем) различные информационные ресурсы Интернета (Интернет-документы). Создает индекс базы данных, помещая туда информацию о ресурсах Сети. При этом он также периодически возвращается к информационным ресурсам и проверяет их на наличие изменений. Когда пользователь делает поисковой системе; запрос, ее программное обеспечение (поисковая машина) просматривает созданный индекс базы данных в поиске ресурсов с заданными ключевыми словами и ранжирует (упорядочивает) эти ресурсы по степени близости к предмету поиска.
Относительно алгоритма функционирования ИПС следует сделать ряд замечаний. В каждой конкретной поисковой системе хранятся (сведения не о всех документах Интернета, а только о тех документах которые известны данной системе (для различных систем процент проиндексированных документов различен, но, как правило, не превышает 30%). В поисковых системах хранятся не сами документы, а только сведения о них, достаточные для их нахождения пользователем и, как следствие этого, поисковая система в результатах поиска может и не выдавать некоторые соответствующие запросу документы. В результате поиска (отклике на запрос) системой сортируются документы по степени соответствия сделанному пользователем запросу с точки зрения алгоритма поисковой системы, а не с точки зрения их фактического соответствия запросу. Данная особенность систем значительно экономит время, затрачиваемое на поиск требуемой информации, особенно когда комбинация слов запроса встречается в нескольких тысячах или миллионах документов, однако нередки и случаи, когда наиболее соответствующие запросу документы не являются первыми в выданном списке. В данном случае следует соблюдать компромисс между количеством просматриваемых документов и общим числом найденных документов (как правило, требуемая информация содержится в первых нескольких десятках найденных документов), но наиболее типичным действием является уточнение запроса с помощью средств уточнения запроса, предоставляемых данной системой. К формированию более детального запроса также следует обратиться, если в результатах поиска много информационного шума (т.е. не соответствующей запросу информации), что, как правило, свидетельствует о неудачно подобранных терминах запроса (например, они подвержены полисемии (т.е. имеют несколько значений)). В промежутках между работой робота-индексировщика системы документы изменяются пользователями, но эти изменения часто учитываются поисковой системой не мгновенно, а спустя некоторый промежуток времени, определяемый периодом индексирования Интернета, поэтому некоторая информация может быть в системе потенциально недоступной в конкретный момент времени.
Поисковые системы следует применять, если требуется найти информацию по специфичным вопросам или для обеспечения полноты охвата ресурсов.
Примером применения при поиске информационно-поисковых систем могут являться требования найти сайт конкретной организации или дать ответ на вопрос «Причины введения единого экзамена в средних школах?».
К наиболее известным поисковым системам относятся такие службы, как Google (http://www.qooqle.com) и Яндех (http://www.yandex.ru).
|
|
|