Информационный процесс. Обработка информации
Категория реферата: Рефераты по информатике, программированию
Теги реферата: контрольные 2 класс 2 четверть, реферат на тему характеристика
Добавил(а) на сайт: Яндашевский.
Предыдущая страница реферата | 1 2 3 4 5
Быстродействие средств обработки информации (ЭВМ, микропроцессоров) определяется уровнем развития науки и технологии, и путь, связанный с увеличением быстродействия, не обеспечивает быстрого решения проблемы. А вот сократить объем обрабатываемой измерительной информации во многих случаях можно. Взять хотя бы такой пример: испытывается серийный тип самолета. При этом из предыдущих испытаний самолетов того же типа достаточно подробно известны его важнейшие параметры. В этом случае нет необходимости передавать и обрабатывать параметры, пока они находятся в норме. Но если тот или иной параметр существенно отклонился от нормы, то его необходимо передавать и обрабатывать. Такой подход позволяет иногда во много раз сокращать объем обрабатываемой измерительной информации и время ее обработки.
Измерительные сигналы могут содержать избыточную информацию. Если устранить из измерительных сигналов избыточную информацию, можно повысить эффективность обработки измерительной информации.
Устранение избыточности информации измерительных сигналов получило название сжатия измерительных сигналов.
В общем виде задача сжатия формулируется следующим образом: найти преобразование сигнала, сохраняющее важную (полезную) информацию и обеспечивающее минимальный ее объем. При таком подходе понимания информации недостаточно, так как здесь приходится оперировать понятиями важности или ценности информации. Эти понятия по своему характеру являются эвристическими, обычно они выводятся из целевой функции (тоже эвристическое понятие), если эта целевая функция может быть достаточно четко определена.
Этот недостаток самой общей постановки задачи сжатия обусловил появление ряда менее общих постановок этой задачи, опирающихся на различные математические модели измерительных, сигналов. Иногда выбор модели диктуется условиями измерительного эксперимента, иногда же он достаточно произволен. Выбор удачной модели во многом зависит от экспериментатора, от его опыта и интуиции.
Один из подходов к решению задачи сжатия предложен академиком А.Н. Колмогоровым. Подход основывается на понятии e-энтропии класса функции, которую в данном случае следует понимать как количество информации, необходимое для описания любой функции этого класса с погрешностью, не превышающей e. Задать класс сигналов – это значит указать некоторые параметры (обычно границы этих параметров), определяющие этот класс. Например, можно определить класс сигналов, для которых первая производная (скорость изменения) не превышает по абсолютному значению некоторого предельного значения M, или класс сигналов, максимальная частота спектра которых не превышает Fmax, или класс сигналов – функций времени x(t), удовлетворяющих условию Липшица x(t2) - x(t1) £ L(t2 - t1), где L – некоторая постоянная.
Таким образом, класс сигналов задается полностью априорно. Вообще, чем больше объем априорной информации, тем большее сжатие может быть достигнуто.
Как и любые преобразования сигналов, сжатие может быть обратимым или необратимым. Сжатие считается обратимым, если по сжатым данным может быть восстановлен исходный сигнал с точностью до допустимой ошибки e, в противном случае сжатие необратимо.
Если входной сигнал, подлежащий сжатию, является непрерывным во времени (аналоговым), то говорят о сжатии процессов. Если же сигнал уже дискретизирован, т.е. существует в дискретные моменты времени в виде ряда отсчетов и эти отсчеты имеют вид числовых кодов, то говорят о сжатии числовых последовательностей.
Переработка текстовой информации
Переработка информации, представленной в виде текстов на естественном языке, имеет много аспектов. Сюда относятся такие виды информационных процессов, как понимание текстов, их перефразирование (пересказ, перевод на другой язык), сжатие семантической информации. Особенное значение имеет последний тип переработки; сюда относятся классификация и индексирование документов, аннотирование и реферирование их.
Структура сигнала измерительной информации передает и его значение. В текстовой информации это не всегда так. В силу специфики языка в форме сообщения, представленного в виде текста, не просматривается содержание, поэтому обработка текстов требует особых приемов, заключающихся в передаче смысла с помощью человека-интерпретатора либо с помощью различных искусственных методов.
Цель процедуры автоматизированного реферирования – выделить из текста документа наиболее важные положения, как можно более полно раскрывающие суть изложенного исследования. В качестве исходного материала для такого реферата служат предложения, составляющие текст документа. В результате отбора некоторых из них получается сокращенный вариант исходного документа, который не является рефератом в полном смысле этого слова. Этот сжатый таким образом текст принято называть квазирефератом.
Одна из первых систем автоматического квазиреферирования базировалась на предложении, что для каждого документа специфические слова, наиболее часто встречающиеся в нем, используются для передачи основной идеи, изложенной текстом. Разработчик этой системы Г. Лун пользовался следующей оценкой значимости каждого из предложений, составляющих документ: Vпр = Nзс2/Nc, где Vпр – значимость предложения; Nзс – число значимых слов в этом предложении, т.е. таких слов, которые являются специфическими для предметной области, к которой относится документ, и для самого этого документа; Nc – общее число слов в предложении. При такой методике квазиреферат составляет совокупность разрозненных фраз, так что понять смысл реферата можно только после дополнительной обработки полученного текста человеком.
Задача обработки связного текста и генерации таких текстов является довольно трудной, она слабо поддается формализации в полном объеме. Однако разработан ряд методик, позволяющих повысить связность текстов по сравнению с простым отбором наиболее значимых предложений. Одна из них заключается в том, что наиболее связанными считаются такие предложения, которые содержат наибольшее количество одних и тех же значимых слов.
Другая методика оценки семантической значимости предложений для отбора их в квазиреферат основана на определении количества информации, содержащейся в каждом из них. Для этого необходимо произвести частотный анализ текста с точки зрения встречаемости в нем важнейших терминов. По гипотезе автора этой методики В. Пурто, чем более важным является для некоторого текста тот или иной термин, тем чаще он встречается в нем. Поэтому для квазиреферата отбираются такие предложения, которые содержат наибольшее количество терминов, чаще всего повторяющихся в данном документе.
Заключение
В теории информации в наше время разрабатывают много систем, методов, подходов, идей. Однако ученые считают, что к современным направлениям в теории информации добавятся новые, появятся новые идеи. В качестве доказательства правильности своих предположений они приводят «живой», развивающийся характер науки, указывают на то, что теория информации удивительно быстро и прочно внедряется в самые различные области человеческого знания. Теория информации проникла в физику, химию, биологию, медицину, философию, лингвистику, педагогику, экономику, логику, технические науки, эстетику. По признанию самих специалистов, учение об информации, возникшее в силу потребностей теории связи и кибернетики, перешагнуло их рамки. И теперь, пожалуй, мы вправе говорить об информации как научном понятии, дающем в руки исследователей теоретико-информационный метод, с помощью которого можно проникнуть во многие науки о живой и неживой природе, об обществе, что позволит не только взглянуть на все проблемы с новой стороны, но и увидеть еще не увиденное. Вот почему термин «информация» получил в наше время широкое распространение, став частью таких понятий, как информационная система, информационная культура, даже информационная этика.
Многие научные дисциплины используют теорию информации, чтобы подчеркнуть новое направление в старых науках. Так возникли, например, информационная география, информационная экономика, информационное право.
Но чрезвычайно большое значение приобрел термин «информация» в связи с развитием новейшей компьютерной техники, автоматизацией умственного труда, развитием новых средств связи и обработки информации и особенно с возникновением информатики.
Одной из важнейших задач теории информации является изучение природы и свойств информации, создание методов ее обработки, в частности преобразования самой различной современной информации в программы для ЭВМ, с помощью которых происходит автоматизация умственной работы – своеобразное усиление интеллекта, а значит, развитие интеллектуальных ресурсов общества.
Список литературы
1. Л.Ф. Куликовский, В.В. Мотов "Теоретические основы информационных процессов: Учеб. пособие для вузов". – М., 1987.
2. Л.Ф. Куликовский, В.К. Морозов, В.Г. Жиров "Элементы теории информационных процессов: Учеб. пособие. – Куйбышев, КПтИ, 1979.
3. В.П. Косарев и др. "Компьютерные системы и сети: Учеб. пособие. – М.: Финансы и статистика, 1999.
4. В. Дмитриев "Прикладная теория информации". – М., 1989.
Скачали данный реферат: Jachevskij, Shikalov, Мавра, Tverdislav, Dudko, Kacen, Florentin.
Последние просмотренные рефераты на тему: лицо реферата, диплом государственного образца, особенности курсовой работы, шпоры по праву.
Предыдущая страница реферата | 1 2 3 4 5