Концепция
сжатия видео в MPEG очень проста
- определить, какая именно информация в потоке повторяется
хотя бы в течение какого-то отрезка времени и принять меры
к избежанию дублирования этой информации. Наиболее ценное
достоинство MPEG кодирования, особенно
удобное для передачи по различным сетям - возможность гибкой
настройки качества изображения в зависимости от пропускной
способности сети. Это и сделало MPEG-2
фактическим стандартом для приема/передачи цифрового телевидения
по различным сетям.
К сожалению, не существует возможности однозначно оценить
качество кодирования некими приборами и измерениями. Единственный
критерий здесь - человек и как он воспримет сжатую информацию.
Поэтому правила сжатия видеоданных при MPEG
кодировании вырабатывались на основе модели восприятия человеком
видеоизображений (HVS - Human
Visual Sense). Избыточность
изображения согласно HVS определяется
по трем основным критериям:
- Невидимые человеческим глазом детали изображения - места
гашения по вертикали и горизонтали. Удаление этой информации
вообще никак не сказывается на изображении;
- Статистическая избыточность. Подразделяется на пространственную
и временную. Под пространственной избыточностью понимаются
участки изображения, на которых смежные пиксели практически
одинаковы. Под временной - не изменяемые во времени фрагменты
изображения;
- Избыточность по цвету и яркости - рассчитывается исходя
из ограниченной чувствительности человека к небольшим изменениям
цветов и яркости деталей изображения.
Как реализуется формат MPEG.
Для удобства кодирования видеоданных весь видеопоток разбивается
на группы, называемые GOP (Group
of Pictures - Группа изображений).
Такая группа строится, как показано на Рис. 1.3

Рис. 1.3. «Устройство» формата MPEG
На рисунке изображены следующие кадры:
- I - Intra-кадры, которые
обычно называются опорными и содержат всю информацию об
изображении. MPEG последовательности
без этих кадров быть не может в принципе. При компрессии
I-кадров происходит удаление только
пространственной избыточности. Именно с этого кадра начинается
декодирование изображения в последовательности;
- Р - Predictive кадры.
«Предсказанные» кадры, при формировании которых используется
метод предсказания изображения на следующем кадре с учетом
компенсации движения от последнего I
или Р-кадра перед формируемым.
Р-кадр также служит для дальнейшего
предсказания изображения. Р-кадр
создается с помощью межкадровой компрессии, уменьшающей
как пространственную, так и временную избыточность. Изображение
Р-кадра вычитается из следующего
изображения и эта разница кодируется и вместе с вектором
движения добавляется к сжатым данным;
- В - Bi-directional,
«двунаправленные» кадры. Они названы так потому, что хранят
наиболее существенную информацию с окружающих их I
и Р-кадров. В кадры имеют наивысшую
степень компрессии, но требуют предыдущего и последующего
изображения для компенсации движения объектов на изображении.
Такую структуру MPEG потока обычно
описывают в виде дроби M/N, для которой М сообщает общее число
кадров в GOP, a N - каким по счету
будет очередной Р-кадр после предыдущего.
Таким образом, GOP-последовательность,
изображенная на рисунке выше, может быть записана как 12/3.
Собственно поток данных MPEG состоит
из 6 иерархических уровней:
- Блок - данные по яркости и цветности
для блоков 8x8 пикселей изображения. Блоки анализируются
по значениям Y (яркость), СВ и CR (цветоразностные сигналы);
- Макроблок — как следует из названия,
состоит из 4 простых блоков в окне 16x16 пикселей соответственно.
В формате 4:2:0 макроблок содержит 4 блока яркостных данных
Y и по одному СВ и CR;
- Слой - содержит несколько смежных
макроблоков;
- Кадр - состоит из группы слоев,
содержащих изображение, которое, в свою очередь, может быть
как I, так Р или В;
- Группа изображений (она же GOP)
- содержит последовательность кадров. Может включать до
15 кадров и должна обязательно начинаться с I кадра;
- Видеопоследовательность — должна
содержать минимум одну GOP, а также заголовок в начале последовательности
и код конца последовательности.
Уровни и профили MPEG
Под профилем MPEG понимается подмножество
структуры битового потока сжатого видеоизображения. В пределах
такого подмножества возможен широкий разброс параметров потока
и, соответственно, кодеров и декодеров для них.
Под уровнем понимается ряд ограничений, применяемых к параметрам
MPEG-потока, например, разрешение
выходного изображения, частота кадров и т.п.
Таблица ниже иллюстрирует максимальные значения ограничений,
накладываемых на уровни и профили MPEG.
Профиль/ уровень |
Простой I, P 4:2:0 (Simple Profile) |
Основной 1, P, В
4:2:0 (Main Profile)
|
I, P, В
4:2:2
|
1,P,B
4:2:0 (SNR Scalable Profile)
|
Пространственный I, P, В 4:2:0 (Spatially
Scalable Profile) |
Высокий 1, P, В 4:2:0 или 4:2:2 (High Profile) |
Самый высокий (High Level) |
|
1920x1152 80 Mbit/s |
|
|
|
1920x1152 100 Mbit/s |
Высокий (High 1440 Level) |
|
1440x1152 60 Mbit/s |
|
|
1440x1152 60 Mbit/s |
1440x1152 80 Mbit/s |
Основной (Main Level) |
720x576 15Mbit/s |
720x576 15 Mbit/s |
720x608 50 Mbit/s |
720x576 15 Mbit/s |
|
720x608 20 Mbit/s |
Низкий (Low Level) |
|
352x288 4 Mbit/s |
|
352x288 4 Mbit/s |
|
|
Эта таблица нужна в первую очередь для понимания часто встречающихся
обозначений формата конкретной записи или описаний возможности
какого-либо кодера. Например, вот так может характеризоваться
запись в формате MPEG:
Название |
Обозначение |
Что есть что |
Standard |
PAL |
Система телевидения 1) |
Resolution |
720*576 |
Разрешение изображения |
Profile and level |
MP@ML |
Main Profile и Main Level |
Frame rate |
25 |
Частота кадров |
Bitrate |
around 5 Mbit avg |
Средняя скорость потока 5 Mbit |
GOP structure |
IBBPBBPBBPBB |
Структура GOP |
1) На самом деле здесь правильнее было бы
написать: PAL - название аналогового стандарта телевидения,
в котором был создан исходный видеофильм. Собственно MPEG
фильм нельзя отнести к какой-либо системе цветного телевидения,
так как кадры в MPEG являются просто цифровым представлением
ранее аналогового изображения и не имеют никакого отношения
даже к исходной для оригинала фильма системе телевидения.
Для видеолюбителя определяющую роль играют всего несколько
наиболее важных параметров настройки MPEG-кодера (компрессора).
Это:
- Bit Rate (Скорость потока)
- измеряется в мегабитах (обратите внимание, в мегабитах,
а не в мегабайтах) в секунду. Чем выше Bit Rate,
тем выше качество изображения, но тем больше места занимает
созданный кодером MPEG файл;
- Constant Bit Rate (Постоянная
скорость потока) - параметр кодирования, указывающий
на то, что скорость потока не должна зависеть от кодируемого
изображения и быть постоянной величиной. Установка постоянной
скорости позволяет точно определить размер итогового файла
фильма, но не оказывает влияния на качество изображения
только в случае одной и той же динамики фильма на всем его
протяжении. Например, в течение фильма непрерывно показываются
автомобильные гонки или медленно и плавно картины в музее;
- Variable Bit Rate (Переменная
скорость потока) - параметр кодирования, указывающий
на то, что скорость потока должна зависеть от динамики изображения
- расти на динамичных сценах и уменьшаться на статичных.
Variable Bit Rate применяется
сейчас наиболее широко, так как позволяет в подавляющем
большинстве случаев добиться лучшего качества видео по сравнению
с Constant Bit Rate при том же
размере файла результата;
- Average Bit Rate (Средняя
скорость потока) - параметр, совпадающий по значению
с Constant Bit Rate при постоянной
скорости потока и оговаривающий среднюю скорость потока
с Variable Bit Rate.
Используя MPEG или планируя его
использовать, следует помнить, что MPEG
ориентирован на хранение и передачу видеоданных, но не на
их обработку. Редактировать, т.е. каким-либо образом изменять
видео в любом из форматов MPEG крайне
неудобно и приводит в подавляющем большинстве случаев к потере
качества исходного видеоматериала, не говоря уже о больших
по сравнению с любыми другими форматами временных затратах
компьютера на редактирование.
С уважением, Igon
Статья подготовлена с использованием материалов
из книги "Быстро и легко. Цифровые видеокамеры, видеомонтаж
и фабрика видеодисков дома: Ulead MediaStudio Pro 6.5",
С.М. Блохин, Ф.А. Резников, изд. Лучшие книги, Москва.
|