Количественная оценка информации
Категория реферата: Рефераты по информатике, программированию
Теги реферата: ответы, діяльність реферат
Добавил(а) на сайт: Лагутов.
Предыдущая страница реферата | 2 3 4 5 6 7 8 9 10 11 12 | Следующая страница реферата
[pic]
Если значение [pic] не удовлетворяет неравенству (88), можно конечные
буквы слова складывать по модулю 2 без сдвига относительно предыдущей
буквы, как это показано на рис 1, б.
Например, если для предыдущего примера со словом “Газета” [pic], сжатый
код будет иметь вид:
[pic]
Метод сжатия информации на основе исключения повторения в старших
разрядах последующих строк, массивов одинаковых элементов старших разрядов
предыдущих строк массивов основан на том, что в сжатых массивах
повторяющиеся элементы старших разрядов заменяются некоторым условным
символом.
Очень часто обрабатываемая информация бывает представлена в виде набора
однородных массивов, в которых элементы столбцов или строк массивов
расположены в нарастающем порядке. Если считать старшими разряды, расположенные левее данного элемента, а младшими - расположенные правее, то
можно заметить, что во многих случаях строки матриц отличаются друг от
друга в младших разрядах. Если при записи каждого последующего элемента
массива отбрасывать все повторяющиеся в предыдущем элементы, например в
строке стоящие подряд элементы старших разрядов, то массивы могут быть
сокращены от 2 до 10 и более разрядов [2].
Для учета выброшенных разрядов вводится знак раздела [pic], который
позволяет отделить элементы в свернутом массиве. В случае полного
повторения строк записывается соответствующе количество [pic]. При
развертывании вместо знака [pic] восстанавливаются все пропущенные разряды, которые были до элемента, стоящего непосредственно за [pic] в сжатом
тексте.
Для примера рассмотрим следующий массив:
[pic]
Свернутый массив будет иметь вид:
[pic]
Расшифровка (развертывание) происходит с конца массива. Переход на
следующую строку происходит по двум условиям: либо по заполнению строки, либо при встрече [pic].
[pic]
Пропущенные цифры заполняются автоматически по аналогичным разрядам предыдущей строки. Заполнение производится с начала массива. Этот метод можно развить и для свертывания массивов, в которых повторяющиеся разряды встречаются не только с начала строки. Если в строке один повторяющийся участок, то кроме [pic] добавляется еще один дополнительный символ К, означающий конец строки. Расшифровка ведется от К до К. Длина строки известна. Нужно, чтобы оставшиеся между K цифры вместе с пропущенными разрядами составляли полную строку. При этом нам все равно, в каком месте строки выбрасываются повторяющиеся разряды, лишь бы в строке было не более одного участка с повторяющимися разрядами. Например:
[pic]
Если в строке есть два повторяющихся участка, то, используя этот метод, выбрасываем больший.
Процесс развертывания массива осуществляется следующим образом: переход на следующую строку происходит при встрече К
[pic]
Пропущенные цифры заполняются по аналогичным разрядам предыдущей строки
начиная с конца массива.
Если в строке массива несколько повторяющихся участков, то можно вместо
[pic] вставлять специальные символы, указывающие на необходимое число
пропусков.
Например, если обозначить количество пропусков, соответственно, Х - 2; Y
- 3; Z - 5, то исходный и свернутый массивы будут иметь вид:
[pic]
Процесс развертывания массива осуществляется следующим образом: длина
строки известна, количество пропусков определяется символами X, Y, Z
[pic]
Пропущенные цифры заполняются по аналогичным разрядам предыдущей строки.
Условием перехода на следующую строку является заполнение предыдущей
строки.
Метод Г. В. Ливинского основан на том, что в памяти машины хранятся
сжатые числа, разрядность которых меньше разрядности реальных чисел. Эффект
сжатия достигается за счет того, что последовательности предварительно
упорядоченных чисел разбиваются на ряд равных отрезков, внутри которых
отсчет ведется не по их абсолютной величине, а от границы предыдущего
отрезка. Разрядность чисел, получаемых таким образом, естественно, меньше
разрядности соответствующих им реальных чисел [18, 21].
Для размещения в памяти ЭВМ М кодов, в которых наибольшее из кодируемых
чисел равно N, необходим объем памяти
[pic]
С ростом N длина кодовой комбинации будет расти как [pic]. Для экономии
объема памяти Q, число [pic], где выражение в скобках - округленное
значение [pic] до ближайшего целого числа, разбивают на L равных частей.
Максимальное число в полученном интервале чисел будет не больше [pic].
Величина [pic] определяет разрядность хранимых чисел, объем памяти для их
хранения будет не больше [pic]. Если в памяти ЭВМ хранить адреса границ
отрезков и порядковые номера хранимых чисел, отсчитываемых от очередной
границы, то [pic] определяет разрядность чисел для выражения номера границы
(в последнем интервале должно быть хотя бы одно число); объем памяти для
хранения номеров границ будет [pic] где [pic] - число границ между
отрезками (это число всегда на единицу меньше, чем число отрезков). Общий
объем памяти при этом будет не больше
[pic] (89)
Чтобы найти, при каких L выражение (89) принимает минимальное значение, достаточно продифференцировать его по L и, приравнять производную к нулю.
Нетрудно убедиться, что [pic] будет при
[pic][20] (90)
Если подставить значение [pic] в выражение (89), то получим. значение
объема памяти при оптимальном количестве зон, на, которые разбиваются
хранимые в памяти ЭВМ числа,
[pic] (91)
Для значений [pic] при вычислениях можно пользоваться приближенной формулой
[pic] (92)
При поиске информации в памяти ЭВМ прежде всего определяют значение [pic]
и находят величину интервала между двумя границами
[pic]
Затем определяют, в каком именно из интервалов находится искомое число х
[pic]
После этого определяется адрес искомого числа как разность между абсолютным
значением числа и числом, которое является граничным для данного интервала.
--------------------
[1] Первичный алфавит составлен из m1 символов (качественных признаков), при помощи которых записано передаваемое сообщение. Вторичный алфавит
состоит из m2 символов, при помощи которых сообщение трансформируется в
код.
[2] Строго говоря, объема информации не существует. Мы вкладываем в этот
термин то, что привыкли под этим подразумевать, - количество элементарных
символов в принятом (вторичном) сообщении.
[3] Суть взаимозависимости символов букв алфавита заключается в том, что
вероятность появления i-й буквы в любом месте сообщения зависит от того, какие буквы стоят перед ней и после нее, и будет отличаться от безусловной
вероятности pi, известной из статистических свойств данного алфавита.
' Рассмотрение семантической избыточности не входит в задачи теории информации.
[4] Здесь и далее под термином «оптимальный код» будем подразумевать коды с практически нулевой избыточностью, так как сравниваем длину кодовой комбинации с энтропией источника сообщений, не учитывая взаимозависимость символов. С учетом взаимозависимости символов эффективность кодирования никогда не будет 100 %, т. е.
[pic]
Кроме того, являясь оптимальным с точки зрения скорости передачи информации, код может быть неоптимальным с течки зрения предъявляемых к нему требований помехоустойчивости.
Рекомендуем скачать другие рефераты по теме: научный журнал, деньги реферат.
Предыдущая страница реферата | 2 3 4 5 6 7 8 9 10 11 12 | Следующая страница реферата