Системы видеонаблюдения (ВН, СОТВ, CCTV)
|
Форматы сжатия видеосигнала
Цифровой
видеосигнал, получаемый в системах видеонаблюдения с видеокамер,
имеет очень большой размер. Для снижения
затрат на устройства хранения информации,
видеосигнал подлежит последующему
сжатию (компресии). В ходе этого процесса
происходит частичная потеря качества
изображения.
Но именно благодаря
сжатию современные системы видеозаписи
позволяют хранить архивы глубиной в
несколько недель и даже месяцев.
Существует
несполько различных форматов сжатия
исходного видеосигнала. Нередко,
особенно это было развито несколько
лет назад, производители видеоаппаратуры
используют свои, модифисированные
версии форматов сжатия, что приводит к
несовместимости записанных данных. К
счастью, в последнее время наметилась
тенденция к стандартизации форматов
сжатия.
Наиболее
распространенными форматами сжатия
видеоизображения на сегодняшний день
являются MPEG-4, M-JPEG и wavelet.
MPEG-1
Формат сжатия видеоданных MPEG-1 был
разработан Motion Picture Expert Group -- международной
организацией, создающей стандарты
сжатия видеоинформации. Он поддерживает
максимальное разрешение кадра 4095 x 4095
пикселов при частоте их смены до 60 раз
в секунду. Однако обычно используют
разрешение 352 x 288, соответствующее
качеству записи на обычную кассету VHS.
Как происходит сжатие информации в
этом формате? Предположим, что у нас
есть следующая сцена: автомобиль движется
из пункта "А" в пункт "Б".
Перемещение машины можно описать двумя
параметрами: вектором перемещения из
точки "А" в точку "Б" и углом
поворота вокруг своей оси. Задний план
при этом остается неизменным или почти
неизменным -- зритель вряд ли обратит
внимание на колебания мелких веток у
дальних деревьев. Следовательно, можно
разбить кадр на две составные части --
задний план, который сохраняется один
раз, а затем подставляется при
воспроизведении всех кадров, и область,
где движется машина, -- ее придется
записывать отдельно для каждого кадра.
В формате MPEG-1 все кадры видеоролика
подразделяются на три типа: I-, P- и B-кадры.
К первому типу (I-кадры, Intra Frames) относятся
опорные кадры. Их изображения сохраняются
в полном объеме в формате JPEG. Для P-кадров
(Predicted Frames) записываются только отличия
от предыдущего i-кадра, что требует
намного меньше дискового пространства.
Для B-кадров (Bi-DirectiOnally Interpolated Frames)
сохраняются отличия от предыдущего и
следующего I- или P-кадра.
В итоге размер сжатого файла составляет
примерно 1/35 от исходного. Это значит,
что полуторачасовой фильм с качеством,
эквивалентным аналоговой записи на
кассете VHS, в формате MPEG-1 поместится на
два компакт-диска. Для передачи через
Internet или в сетях спутникового вещания
этот стандарт, конечно же, не подходит.
MPEG-2
MPEG-2 представляет собой дальнейшее
расширение MPEG-1. В нем увеличен рекомендуемый
размер кадра -- теперь он составляет
1920 x x 1080 точек, добавлена поддержка
шестиканального звука. Однако для
воспроизведения видео в этом формате
требуется более высокая вычислительная
мощность компьютера.
Следует отметить, что велась работа
над созданием стандарта MPEG-3 (не путать
с популярным нынче форматом сжатия
звука -- MPEG-1 Audio Layer 3). Он должен был стать
базовым для систем цифрового телевидения
высокой четкости HDTV. Но работа над ним
была прервана, поскольку нужные для
HDTV требования удалось реализовать в
виде небольших расширений к MPEG-2.
Этот формат сейчас довольно широко
распространен на Западе: его используют
для передачи видео по спутниковым
каналам и кабельным сетям цифрового
телевидения, кроме того, все видеодиски
DVD записаны именно в этом формате.
Формат сжатия Motion
JPEG (MJPEG)
MJPEG – алгоритм сжатия JPEG для
видеоинформации. Фактически MJPEG (Motion
JPEG) - это переходный формат от сжатия
обычных фотографий к сжатию видео.
Каждый кадр записывается в формате
JPEG, а затем помещается в видеоряд и
представляет собой стандартизированный
формат записи потока отдельных кадров,
каждый из которых сжат по алгоритму
JPEG независимо от остальных. При
использовании алгоритма сжатия MJPEG
средний коэффициент сжатия видеосигнала
составляет около 1:5, а скорость передачи
видео с разрешением 720х576 пикселей – до
5 Мбит/с.
Формат сжатия MPEG 4
MPEG4 использует технологию так называемого
фрактального сжатия изображений.
Фрактальное (контурно-основанное) сжатие
подразумевает выделение из изображения
контуров и текстур объектов. Контуры
представляются в виде т.н. сплайнов
(полиномиальных функций) и кодируются
опорными точками. Текстуры могут быть
представлены в качестве коэффициентов
пространственного частотного
преобразования (например, дискретного
косинусного или вейвлет-преобразования).
Диапазон скоростей передачи данных,
который поддерживает формат сжатия
видео изображений MPEG 4, гораздо шире,
чем в MPEG 1 и MPEG 2. Дальнейшие разработки
специалистов направлены на полную
замену методов обработки, используемых
форматом MPEG 2. Формат сжатия видео
изображений MPEG 4 поддерживает широкий
набор стандартов и значений скорости
передачи данных. MPEG 4 включает в себя
методы прогрессивного и чересстрочного
сканирования и поддерживает произвольные
значения пространственного разрешения
и скорости передачи данных в диапазоне
от 5 кбит/с до 10 Мбит/с. В MPEG 4 усовершенствован
алгоритм сжатия, качество и эффективность
которого повышены при всех поддерживаемых
значениях скорости передачи данных.
Форматы MPEG-1 и MPEG-2 не обеспечивали
реальной возможности трансляции видео
по сети Internet и создания интерактивного
телевидения на их основе -- слишком уж
большим был размер файлов. Для его
радикального уменьшения, а также
реализации других функций, необходимых
для передачи потокового видео, была
начата работа над спецификациями нового
формата -- MPEG-4. По сути, он ориентирован
не столько на сжатие видео, сколько на
создание так называемого "мультимедийного
контента" -- слияния интерактивного
телевидения, 3D-графики, текста и т. д.
Что касается самого видео, то важнейшим
нововведением стало дальнейшее
усовершенствование технологий разложения
сцены на объекты и алгоритмов их
эффективного сжатия. Так, например, при
сжатии видеозаписи теннисного матча
большинство кадров можно условно
разложить на изображения трибун (задний
план) и теннисистов. Внимание зрителя,
скорее всего, будет приковано к игрокам,
поэтому детализацию заднего плана можно
уменьшить (это даст дополнительную
экономию места), а игроков -- увеличить.
Для типовых объектов даже разработаны
отдельные алгоритмы предсказания и
описания их движений -- это касается, в
частности, походки людей, наиболее
распространенных жестов, мимики. Теперь
такие изменения в кадрах нет нужды
записывать вообще -- их можно рассчитать
программно.
В MPEG-4 поддерживается отображение
текста различными шрифтами поверх
видеоизображения. Более того, этот текст
может быть озвучен с помощью синтезатора
речи с возможностью имитации мужских
и женских голосов. При необходимости
голос синхронизируется с движениями
лица диктора в соответствии с произносимыми
фонемами. Также может синтезироваться
звучание некоторых музыкальных
инструментов. Сжатие оцифрованных
звукозаписей осуществляется более
эффективно с помощью специально
разработанного кодека AAC (Advanced Audio Codec).
Для воспроизведения видео в формате
MPEG-4 требуется достаточно большая
вычислительная мощность ПК, но зато по
эффективности сжатия он не имеет себе
равных.
Формат сжатия Wavelet
Последовательность действий, которую
использует метод сжатия Wavelet, в целом
аналогична алгоритму JPEG. Принципиальная
разница состоит в способе преобразования
видеосигнала: метод сжатия JPEG использует
дискретно-косинусное преобразование
сигнала, тогда как метод сжатия Wavelet
представляет сигнал как суперпозицию
конечных во времени негармонических
функций – вейвлетов. В отличие от JPEG,
изображение обрабатывается без разбиения
на квадраты.
С математической точки зрения основной
особенностью wavelet-преобразования
является возможность разложить
изображение на две компоненты -
низкочастотную часть, содержащую
основную информацию, и высокочастотную
часть, содержащую лишь малую долю
информации. Низкочастотную часть можно
опять разложить на две части, и т.д.
Оставшаяся часть изображения содержит
лишь малые высокочастотные компоненты.
В результате последовательного применения
wavelet-преобразований получается
изображение, занимающее небольшой объем
места на диске. Метод сжатия Wavelet
преобразует изображение по следующему
алгоритму: · Преобразование
цветового пространства ·
Вейвлет-преобразование · Квантование ·
Кодирование Вейвлет-преобразование После
преобразования в цветовое пространство
типа цветность/яркость изображение
обрабатывается высокочастотным и
низкочастотным фильтрами по строкам и
столбцам с последующим прореживанием.
Фильтр представляет собой небольшое
«окно». Значения яркости и цветности
попавших в него пикселей умножаются на
заданный набор коэффициентов, а полученные
значения суммируются, и «окно»
сдвигается для расчета следующего
значения. В результате фильтрации вместо
одного изображения размером mxn
вейвлет-преобразование дает четыре
изображения размером (m/2) x (n/2). Фильтрация
низкочастотным фильтром по горизонтали
и по вертикали дает самое высокоинформативное
изображение, которое подвергается
дальнейшей фильтрации (число уровней
фильтрации обычно составляет от 4 до
6), тогда как результат обработки
высокочастотным фильтром по горизонтали
и по вертикали чаше всего отбрасывается.
Изображения, полученные с применением
высокочастотного фильтра по строкам и
низкочастотного по столбцам или
низкочастотного фильтра по строкам и
высокочастотного по столбцам, квантуются
и после кодирования попадают в выходной
поток. Результатом вейвлет-преобразования,
как и дискретного косинусного
преобразования, является массив числовых
коэффициентов. На следующем этапе
происходит квантование этого массива,
и близкие к нулю коэффициенты отбрасываются.
Затем массив подвергается кодированию.
Преимущество метода сжатия Wavelet перед
JPEG состоит в том, что Wavelet преобразует
полное изображение, а не его отдельные
фрагменты, и позволяет получить
качественное изображение при больших
(до 100) коэффициентах сжатия. При высокой
степени компрессии метод сжатия Wavelet
может давать искажения, имеющие вид
ряби вблизи резких границ, однако такие
артефакты в среднем меньше бросаются
в глаза наблюдателю, чем «мозаика»,
создаваемая JPEG.
После того, как фирма Analogue Devices выпустила
специализированную микросхему аппаратного
wavelet-сжатия видео, данный формат стал
базисом многоканальных цифровых систем
видеонаблюдения и цифровых
видеорегистраторов. Как и в случае
формата JPEG, в Wavelet сжатие осуществляется
с необратимыми потерями информации, но
изображение не имеет "мозаичных"
дефектов даже при очень больших степенях
компрессии. Достоинство - отсутствие
видимых дефектов даже при большом
коэффициенте сжатия видео, - снижается
резкость, и изображение просто становится
менее четким.
Применение Wavelet-сжатия открыло перед
охранными системами видеонаблюдения
новые возможности. Сжатое видео при
малом объеме передаваемой информации
[до 400 Кбит/с с компрессией 150:1] может
быть передано через сеть Internet, по модему
или по мобильному телефону, что позволяет
дистанционно наблюдать за охраняемым
объектом практически в режиме реального
времени.
В 2000 году вариант сжатия методом
Wavelet включен в стандарт JPEG (метод сжатия
JPEG-2000).
Формат сжатия Jpeg2000
В последнее время в
линейке оборудования ведущих производителей видеорегистраторов (аппаратных и программных) все чаще используется новый современный формат
хранения графических изображений и
видеоданных Jpeg2000, отличающийся высокой
эффективностью компрессии.
Основанный на wavelet-преобразовании,
Jpeg2000 совместил в себе целый ряд инноваций,
расширяющих возможности систем
видеонаблюдения. Это покадровый метод
компрессии видеоданных. Его особенность
состоит в том, что каждый кадр сжимается
независимо от соседних. Такая изначальная
ориентация формата имеет преимущество
перед алгоритмами с межкадровой
компрессией (MPEG-2, MPEG-4, H.264) и обеспечивает
одинаково высокое качество всех
записанных кадров.
Использование формата сжатия Jpeg2000
позволяет проводить криминалистические
экспертизы записей и применять средства
автоматической обработки архивных
данных на более высоком уровне. В отличие
от сходных форматов с покадровым методом
компрессии Jpeg2000 -- вместо дискретного
косинусного преобразования -- использует
технологию wavelet-преобразования, основанную
на представлении сигнала в виде волновых
пакетов. За счет этого устраняется
эффект, когда при увеличении сжатия
появляются характерные хорошо заметные
артефакты, например, блочность (разбиение
изображения на блоки 8х8 пикселей),
замыливание (потеря мелких деталей
изображения) и т.д. В применении к задачам
записи видеопотоков Jpeg2000 обладает
следующими основными преимуществами:
-
более высокая степень сжатия по
сравнению с JPEG в среднем на 20%;
-
отношение сигнал/шум: Jpeg2000 обеспечивает
эффективную организацию кодового
потока;
-
JPEG2000 обеспечивает как сжатие с
потерями, так и сжатие без потерь.
Jpeg2000 устойчив к битовым ошибкам, которые
вносятся зашумленными каналами связи.
Это достигается путем вставки маркеров
ресинхронизации, кодирования данных
в относительно небольшие независимые
блоки, и обеспечение механизмов для
нахождения и локализации ошибок.
J2000 - новый для российского рынка бренд.
Тем не менее, преимущества выпускаемого
под ним оборудования, уже вызвали интерес
участников рынка.
|