Система сжатия подвижных изображений MPEG-2
Категория реферата: Рефераты по радиоэлектронике
Теги реферата: реферат беларусь, образец реферата
Добавил(а) на сайт: Казак.
Предыдущая страница реферата | 1 2 3 4 5 6 | Следующая страница реферата
. 13818-3 – Audio – определяет кодовое представление сигналов звукового сопровождения;
. 13818-2 – Video – регламентирует кодовое представление и процесс декодирования, сжатие потока за счет устранения пространственной и временной избыточности.
Представление сигналов в форме MPEG-2 позволяет обращаться с видео и
звуковыми потоками как с потоками компьютерных данных.
1.Основные понятия стандарта MPEG-2
Как уже было сказано, представление сигналов в форме MPEG-2 позволяет
обращаться с видео и звуковыми потоками как с потоками компьютерных данных.
Поток видеоданных представляет собой иерархическую структуру, объединенную
между собой определенными синтаксическими и семантическими правилами.
Структура включает в себя шесть типов блоков:
. видеопоследовательность;
. группа изображений;
. изображение;
. срез;
. макроблок;
. слайс;
. блок.
Видеопоследовательность – элемент потока видеоданных высшего уровня.
Представляет собой серию последовательных кадров телевизионного
изображения. MPEG-2 допускает построчные и чересстрочные
последовательности, подробнее на этом мы остановимся позднее. Определены
три типа изображений, в соответствии с методом дифференциального
кодирования:
I (Intra-coded picture) – изображение кодируется с использованием только той информации, которая заложена в нем самом; устраняется пространственная избыточность;
P (Predictive coded picture) – изображение, при кодировании которого формируется разность между исходным изображением и предсказанием, полученным на основе предшествующих или последующих I.
B (Bidirctory predictive coded picture) – изображение, при кодирование которого используется предсказание, сформированное на основе предшествующих и последующих I или P.
При кодировании Р и В используются межкадровое кодирование, устраняющее и пространственную и временную избыточность. Серия изображений, содержащих одно I называется группой изображений, стрелками показывается направление предсказания. Чем больше группа – тем больше компрессия (Рис.1).
Рис 1.1 Видеопоследовательность трех видов изображений с предсказаниями
(стрелками указаны направления предсказаний)
2. Компрессия изображений в MPEG-2.
2.1 Процесс сокращения избыточности
С информационной точки зрения, каждое изображение представляет собой
три прямоугольных матрицы отсчетов изображений: яркостную Y и две цветности
Св и Сr. Стандарт MPEG-2 допускает различные структуры матриц (4:2:0;
4:2:2; 4:4:4).
Каждое изображение делится на срезы, которые состоят из макроблоков.
Макроблок содержит блоки размером 8х8 элементов изображения (реже 16х16
элементов); группу из четырех блоков с отсчетами яркости и группы блоков с
отсчетами цветности, число которых зависит от формата (по 1, по 2, по 4).
Группа следующих друг за другом макроблоков называется слайсом .Число
макроблоков в слайсе может быть произвольным, главное, чтобы слайсы в
изображении не перекрывались. Все структурные элементы потока видеоданных, полученных в результате внутрикадрового и межкадрового кодирования (кроме
блока и макроблока), дополняются специальными и уникальными стартовыми
кодами («Заголовок – элементы»). В заголовке приводится разнообразная
дополнительная информация, например, размеры и соотношение сторон
изображения, частота, кодирование, скорости потока, матрица квантования, формат дискретизации цветного изображения, координаты основных цветов и
белого цвета, параметры матрицы для формирования яркости и цветоразностных
сигналов и др.
Сокращение пространственной избыточности выполняется в изображении типа
I и достигается на уровне блока. Набор операций такого кодирования –
дискретное косинусное преобразование; взвешенное квантование; энтропийное
квантование (кодирование серии коэффициентов косинусного преобразования, полученного в результате диагонального сканирования матрицы). Для повышения
точности предсказания используется компенсация движения: оценивается
скорость перемещения движения объектов от кадров и при определенных
предсказаниях производится коррекция в положении опорного изображения, по
отношению к которому находится ошибка предсказания. Определение величины и
направления смещения (вектор движения) производится на уровне макроблоков.
Оценка вектора – сложная процедура, именно она определяет асимметрию кодека
MPEG-2, однако в этом направлении ведутся работы, т.к. эта процедура не
определена жестко. Стандарт предполагает сокращение не только
пространственной, но и временной избыточности. После компрессии объем
изображения Р типичных телевизионных сюжетов составляет 35% от I, В – 25%
от I. Т.о., в три раза уменьшается скорость потока данных при
приблизительно тех же искажениях. Артефакты же связанные с движением (в
отличие от JPEG и DV) замечаемы тем меньше, чем быстрее движутся
изображения.
В случае чересстрочной развертки каждый кадр состоит из двух полей.
Первое поле содержит нечетные строки кадра, а второе поле – четные строки.
При этом возможно два варианта кодирования всего кадра, выбор одного из
которых осуществляется на основе оценки движения в нем.
В случае кадрового кодирования кодируемым изображением является полный кадр, который целиком хранится в запоминающем устройстве кодера. Кадровое кодирование выбирается в случаях, когда изменения во втором поле кадра относительно первого поля того же кадра незначительны.
Рекомендуем скачать другие рефераты по теме: решебник по русскому класс, культурология, культурология как наука.
Предыдущая страница реферата | 1 2 3 4 5 6 | Следующая страница реферата