О себе Бодибилдинг digital_video
Статьи - MPEG-формат
Ulead MediaStudio       6.5
Статьи
Ссылки
 
 
 

    Концепция сжатия видео в MPEG очень проста - определить, какая именно информация в потоке повторяется хотя бы в течение какого-то отрезка времени и принять меры к избежанию дублирования этой информации. Наиболее ценное достоинство MPEG кодирования, особенно удобное для передачи по различным сетям - возможность гибкой настройки качества изображения в зависимости от пропускной способности сети. Это и сделало MPEG-2 фактическим стандартом для приема/передачи цифрового телевидения по различным сетям.

К сожалению, не существует возможности однозначно оценить качество кодирования некими приборами и измерениями. Единственный критерий здесь - человек и как он воспримет сжатую информацию. Поэтому правила сжатия видеоданных при MPEG кодировании вырабатывались на основе модели восприятия человеком видеоизображений (HVS - Human Visual Sense). Избыточность изображения согласно HVS определяется по трем основным критериям:

  • Невидимые человеческим глазом детали изображения - места гашения по вертикали и горизонтали. Удаление этой информации вообще никак не сказывается на изображении;
  • Статистическая избыточность. Подразделяется на пространственную и временную. Под пространственной избыточностью понимаются участки изображения, на которых смежные пиксели практически одинаковы. Под временной - не изменяемые во времени фрагменты изображения;
  • Избыточность по цвету и яркости - рассчитывается исходя из ограниченной чувствительности человека к небольшим изменениям цветов и яркости деталей изображения.

Как реализуется формат MPEG.

Для удобства кодирования видеоданных весь видеопоток разбивается на группы, называемые GOP (Group of Pictures - Группа изображений). Такая группа строится, как показано на Рис. 1.3


Рис. 1.3. «Устройство» формата MPEG

На рисунке изображены следующие кадры:

  • I - Intra-кадры, которые обычно называются опорными и содержат всю информацию об изображении. MPEG последовательности без этих кадров быть не может в принципе. При компрессии I-кадров происходит удаление только пространственной избыточности. Именно с этого кадра начинается декодирование изображения в последовательности;
  • Р - Predictive кадры. «Предсказанные» кадры, при формировании которых используется метод предсказания изображения на следующем кадре с учетом компенсации движения от последнего I или Р-кадра перед формируемым. Р-кадр также служит для дальнейшего предсказания изображения. Р-кадр создается с помощью межкадровой компрессии, уменьшающей как пространственную, так и временную избыточность. Изображение Р-кадра вычитается из следующего изображения и эта разница кодируется и вместе с вектором движения добавляется к сжатым данным;
  • В - Bi-directional, «двунаправленные» кадры. Они названы так потому, что хранят наиболее существенную информацию с окружающих их I и Р-кадров. В кадры имеют наивысшую степень компрессии, но требуют предыдущего и последующего изображения для компенсации движения объектов на изображении.

Такую структуру MPEG потока обычно описывают в виде дроби M/N, для которой М сообщает общее число кадров в GOP, a N - каким по счету будет очередной Р-кадр после предыдущего. Таким образом, GOP-последовательность, изображенная на рисунке выше, может быть записана как 12/3. Собственно поток данных MPEG состоит из 6 иерархических уровней:

  • Блок - данные по яркости и цветности для блоков 8x8 пикселей изображения. Блоки анализируются по значениям Y (яркость), СВ и CR (цветоразностные сигналы);
  • Макроблок — как следует из названия, состоит из 4 простых блоков в окне 16x16 пикселей соответственно. В формате 4:2:0 макроблок содержит 4 блока яркостных данных Y и по одному СВ и CR;
  • Слой - содержит несколько смежных макроблоков;
  • Кадр - состоит из группы слоев, содержащих изображение, которое, в свою очередь, может быть как I, так Р или В;
  • Группа изображений (она же GOP) - содержит последовательность кадров. Может включать до 15 кадров и должна обязательно начинаться с I кадра;
  • Видеопоследовательность — должна содержать минимум одну GOP, а также заголовок в начале последовательности и код конца последовательности.

Уровни и профили MPEG

Под профилем MPEG понимается подмножество структуры битового потока сжатого видеоизображения. В пределах такого подмножества возможен широкий разброс параметров потока и, соответственно, кодеров и декодеров для них.

Под уровнем понимается ряд ограничений, применяемых к параметрам MPEG-потока, например, разрешение выходного изображения, частота кадров и т.п.

Таблица ниже иллюстрирует максимальные значения ограничений, накладываемых на уровни и профили MPEG.

Профиль/ уровень Простой I, P 4:2:0 (Simple Profile) Основной 1, P, В
4:2:0 (Main Profile)
I, P, В
4:2:2
1,P,B
4:2:0 (SNR Scalable Profile)
Пространственный I, P, В 4:2:0 (Spatially Scalable Profile) Высокий 1, P, В 4:2:0 или 4:2:2 (High Profile)
Самый высокий (High Level)   1920x1152 80 Mbit/s       1920x1152 100 Mbit/s
Высокий (High 1440 Level)   1440x1152 60 Mbit/s     1440x1152 60 Mbit/s 1440x1152 80 Mbit/s
Основной (Main Level) 720x576 15Mbit/s 720x576 15 Mbit/s 720x608 50 Mbit/s 720x576 15 Mbit/s   720x608 20 Mbit/s
Низкий (Low Level)   352x288 4 Mbit/s   352x288 4 Mbit/s    

Эта таблица нужна в первую очередь для понимания часто встречающихся обозначений формата конкретной записи или описаний возможности какого-либо кодера. Например, вот так может характеризоваться запись в формате MPEG:

Название Обозначение Что есть что
Standard PAL Система телевидения 1)
Resolution 720*576 Разрешение изображения
Profile and level MP@ML Main Profile и Main Level
Frame rate 25 Частота кадров
Bitrate around 5 Mbit avg Средняя скорость потока 5 Mbit
GOP structure IBBPBBPBBPBB Структура GOP

1) На самом деле здесь правильнее было бы написать: PAL - название аналогового стандарта телевидения, в котором был создан исходный видеофильм. Собственно MPEG фильм нельзя отнести к какой-либо системе цветного телевидения, так как кадры в MPEG являются просто цифровым представлением ранее аналогового изображения и не имеют никакого отношения даже к исходной для оригинала фильма системе телевидения.

Для видеолюбителя определяющую роль играют всего несколько наиболее важных параметров настройки MPEG-кодера (компрессора). Это:

  • Bit Rate (Скорость потока) - измеряется в мегабитах (обратите внимание, в мегабитах, а не в мегабайтах) в секунду. Чем выше Bit Rate, тем выше качество изображения, но тем больше места занимает созданный кодером MPEG файл;
  • Constant Bit Rate (Постоянная скорость потока) - параметр кодирования, указывающий на то, что скорость потока не должна зависеть от кодируемого изображения и быть постоянной величиной. Установка постоянной скорости позволяет точно определить размер итогового файла фильма, но не оказывает влияния на качество изображения только в случае одной и той же динамики фильма на всем его протяжении. Например, в течение фильма непрерывно показываются автомобильные гонки или медленно и плавно картины в музее;
  • Variable Bit Rate (Переменная скорость потока) - параметр кодирования, указывающий на то, что скорость потока должна зависеть от динамики изображения - расти на динамичных сценах и уменьшаться на статичных. Variable Bit Rate применяется сейчас наиболее широко, так как позволяет в подавляющем большинстве случаев добиться лучшего качества видео по сравнению с Constant Bit Rate при том же размере файла результата;
  • Average Bit Rate (Средняя скорость потока) - параметр, совпадающий по значению с Constant Bit Rate при постоянной скорости потока и оговаривающий среднюю скорость потока с Variable Bit Rate.

Используя MPEG или планируя его использовать, следует помнить, что MPEG ориентирован на хранение и передачу видеоданных, но не на их обработку. Редактировать, т.е. каким-либо образом изменять видео в любом из форматов MPEG крайне неудобно и приводит в подавляющем большинстве случаев к потере качества исходного видеоматериала, не говоря уже о больших по сравнению с любыми другими форматами временных затратах компьютера на редактирование.

С уважением, Igon

Статья подготовлена с использованием материалов из книги "Быстро и легко. Цифровые видеокамеры, видеомонтаж и фабрика видеодисков дома: Ulead MediaStudio Pro 6.5", С.М. Блохин, Ф.А. Резников, изд. Лучшие книги, Москва.

Домой Наверх
 
Webmaster - Igon mtgtsale@mail.ru, 2003
Hosted by uCoz