Espada - разработка компьютерных комплектующих и электротехнической продукции Espada - разработка компьютерных комплектующих и электротехнической продукции Корпус Espada - разработка компьютерных комплектующих и электротехнической продукции
info@espada-tech.ru
ГЛАВНАЯ НОВИНКИ ГДЕ КУПИТЬ
Лента новостей

Периферийное оборудование

Компьютерные комплектующие

Автоаксессуары


   ПОДДЕРЖКА
support@espada-tech.ru

Сервис-центр
Espada
в Москве

Компания Корвет Трэйдинг, оптовые поставки компьютерых комплектующих



Магазин оптовых продаж подарков и сувениров.

Корвет Северо-Запад - компьютерные комплектующие, опт.

НИКС в городах России



Лучшие Ресурсы RUнета.
Ссылки на другие ресурсы

Проблемы с конвертором AVIConverter 2.0

Модель плеера MP3 & MP4 «ESPADA-317» одна из немногих позволяющих работать с потоками медиа данных упакованных в контейнер AVI. Собрана на процессоре “Rock Chip” RK2606A.

Рассмотрим подробнее вопрос обработки файлов с расширением AVI. Напомним, что такое контейнер AVI.

AVI представляет собой стандартный "контейнер", который может содержать в себе видео- и аудио-потоки, сжатые любыми кодеками (их существует больше сотни)В начале AVI-файла лежит сигнатура требуемых для работы кодеков. Идеология AVI контейнера такова, что его можно обрабатывать в любом соответствующем редакторе, если в системе инсталлированы все требуемые для работы с этим видео файлом кодеки.

1.      «AVIConverter 2.0»

Основным средством, для создания видео файлов, которые воспроизводятся плером «ESPADA-317» является «AVIConverter 2.0», поставляемый вместе с плеером.

«AVIConverter 2.0» - программа для конечного преобразования видео файлов различных форматов в формат AVI c характеристиками необходимыми для воспроизведения плеером MP3 & MP4 «Espada-317».

«AVIConverter 2.0» достаточно мощное и удобное в работе программное обеспечение, которое предназначено для преобразования видео файлов форматов avi, mpg, mpeg, rm, rmvb, wmv, dat и vob в файл AVI упакованный Xvid - подобным кодеком с размером изображения соответствующим разрешению экрана «Espada-317» (220*176 пикселей).

Файлы, преобразованные конвертором «AVIConverter 2.0» воспроизводятся плеером «Espada-317».

2. Особенности программы «AVIConverter 2.0»

А) следует отметить, что данный конвертор поддерживает только латинские имена файлов и папок (нельзя использовать папку «МОИ ДОКУМЕНТЫ»);

Б) хотя «AVIConverter 2.0» в выходном файле указывает сигнатуру Xvid, конвертер не использует полноценный Xvid кодек. Вероятная причина – недостаточная производительность процессора встроенного в МР-4 плеер. Это делает невозможным применение конвертеров отличных от «AVIConverter 2.0»;

В) программа установки конвертера «AVIConverter 2.0» автоматически устанавливает следующие кодеки:

XVID; DivX3,4,5; MS MPEG4v1,2,3; Windows Media Video 1/7, 2/8; 3IV2; 3IVX; RMP4; DM4V; MPEG1; MPEG2; H.263(+); H.264; MJPEG; DV; HuffYUV; CorePNG; MPNG.

3. Типы файлов пригодные для преобразования конвертером «AVIConverter 2.0».

А) Файлы, упакованные в контейнер «AVI» различными кодеками (возможно работает и с большим количеством кодеков, в списке указаны только те кодеки работа с которыми проверялась, можем выслать исходники не конвертированных файлов):

1.      файл формата «Windows Media Video V9» упакован кодеком «WMV3» в контейнер «AVI».

2.      файл формата «Microsoft MPEG-4 Video Codec V2» упакован кодеком «mp42» в контейнер «AVI».

3.      файл формата «Microsoft Video 1» упакован кодеком «CRAM / msvc» в контейнер «AVI».

4.      файл формата «H.264 / MPEG-4 AVC» упакован кодеком «H264/x264» в контейнер «AVI».

5.      файл «XviD 1.1.0 Final» упакован кодеком «xvid» в контейнер «AVI».

6.      файл «XviD ISO MPEG-4» упакован кодеком «Xvid / ffds» в контейнер «AVI».

7.      файл «DivX 5.0.3» упакован кодеком «DX50» в контейнер «AVI».

8.      файл «DivX 6.6.1» упакован кодеком «DX50 / divx» в контейнер «AVI».

9.      файл формата «DVC/DV Video» упакован кодеком «dvsd/dsvd» в контейнер «AVI».

10.  файл «Huffyuv v2.1.1 – CCESP Pach v0.2.5» упакован кодеком «hfyu» в контейнер «AVI».

Б) Файлы стандарта MPEG-1 с расширениями:

1.   *.MPG.

2.   *.MPEG.

В) Файлы стандарта MPEG-2 (DVD «VOB» формат) с расширением:

1.   *.VOB.

2.  *.MPG

Г) Файлы стандарта «Windows Media Video V8» (формат «ASF») упакованы кодеком «WMV2» с расширением:

1.   *.WMV.

Д) Файлы стандарта «Real Media» с расширением:

1.      *.RMVB.

4. Типы файлов с которыми «AVIConverter 2.0» не может работать на прямую.

Файлы формата Apple Quick Time – расширение *.M4V, *.MOV. Рекомендуем использовать программы ULEAD VIDEO STUDIO или ADOBE PRIMERE, для предварительного преобразования формата Apple Quick Time в MJPEG или другие воспринимаемые программой «AVIConverter 2.0».

5. Определение типа кодека и других параметров видео файла подлежащего конвертации для последующего воспроизведения плеером «Espada-317».

Существует два варианта решения этой проблемы.

Первый - использовать проигрыватель, который может отображать расширенную информацию о видео файлах: например LightAlloy или Crystal player.

Вместо проигрывателя вы можете использовать простой редактор видео

VirtualDub (поставляется вместе с плеером «Espada-317»):

откройте файл видеозаписи в меню «Файл» выберите пункт «Информация о файле» и в окне «AVI информация» увидите информацию о видео файле.

Обычно программы отображают так называемый «четырёхсимвольный код» (FourCC), который служит своего рода подписью кодера видео например: ‘DIV3’- DivX 3, ‘DIVX’- DivX 4, ‘DX50’- DivX 5/6, ‘XVID’- XviD. Код формата звука обычно представляется как 4-значное шестнадцатеричное число, например: 0x0055 - mp3, 0x2000 - AC3. Также эти программы указывают формат файла: тип используемого контейнера. Для популярных форматов программа может также указать не только код, но и полное название. В дополнение к этому отображается дополнительная информация, как то: длительность записи, частота кадров, количество каналов и поток данных в звуковой дорожке и др. После того, как вы узнали, какой же формат записи использован, вы можете найти необходимый декодер в Интернете (на сайтах вроде www.free-codeсs.com).

Второй - использовать специальные программы, которые предназначены для определения формата видеозаписей.

AVIcodec позволяет определять формат не только одного, но и нескольких файлов сразу, проверяет наличие поддержки декодирования каждого формата в вашей системе и предлагает скачать недостающие декодеры из Интернета. Программа имеет интерфейс на русском языке. Последняя версия - 1.1.0.4, распространяется бесплатно.

Gspot анализирует содержимое видео файла, обнаруживает все совместимые декодеры в системе, проводит базовую диагностику и даже даёт советы по исправлению типичных проблем с воспроизведением видеозаписей. Пользователю доступно множество параметров различных декодеров, есть возможность тестового воспроизведения. Последняя версия - 2.21, версия 2.52 проходит бета-тестирование, программа распространяется бесплатно. В новой версии можно будет изменять приоритеты использования различных декодеров для воспроизведения определённых форматов сжатия.

abcAVI Tag Editor - эта программа предназначена для редактирования текстовых описателей (тэгов, tags) видеозаписей. Определение формата записи - одна из множества её возможностей. Информация о формате видеозаписей может также выводиться в виде всплывающей подсказки в «Проводнике Windows». Программа позволяет составлять каталоги видеозаписей, переименовывать множество файлов с видеозаписями и многое другое. Программа имеет интерфейс на русском языке. Последняя версия - 1.8.1, распространяется бесплатно.

6. Справка для любознательных.

Характеристики видеосигнала

Количество кадров в секунду

Количество (частота) кадров в секунду — это число неподвижных изображений, сменяющих друг друга при показе 1 секунды видеоматериала и создающих эффект движения объектов на экране. Чем больше частота кадров в секунду, тем более плавным и естественным будет казаться движение. Минимальный показатель, при котором движение будет восприниматься однородным — примерно 10 кадров в секунду (это значение индивидуально для каждого человека). В традиционном плёночном кинематографе используется частота 24 кадра в секунду. Системы телевидения PAL и SÉCAM используют 25 кадров в секунду (англ. 25 fps или 25 Герц), а система NTSC использует 29,97 кадров в секунду. Компьютерные оцифрованные видеоматериалы хорошего качества, как правило, используют частоту 30 кадров в секунду. Верхняя пороговая частота мелькания, воспринимаемая человеческим мозгом, в среднем составляет 39—42 Герца и индивидуальна для каждого человека. Некоторые современные профессиональные камеры могут снимать с частотой до 120 кадров в секунду. А специальные камеры для сверхбыстрой съёмки снимают с частотой до 1000 кадров в секунду и выше, что необходимо, например, для детального изучения траектории полёта пули или структуры взрыва.

Сцена - последовательность кадров, снятых за один приём, не выключая камеры. Все кадры сцены содержат очень похожее изображение.

Чересстрочная развёртка

Развёртка видеоматериала может быть прогрессивной (построчной) или чересстрочной. При прогрессивной развёртке все горизонтальные линии (строки) изображения отображаются одновременно. А вот при чересстрочной развёртке показываются попеременно чётные и нечётные строки (называемые также полями кадра).

Чересстрочную развёртку часто называют на английский манер интерле́йс (англ. interlace) или интерле́йсинг. Чересстрочная развёртка была изобретена для показа изображения на кинескопах и используется сейчас для передачи видео по «узким» каналам, не позволяющим передавать изображение во всём качестве. Системы PAL, SÉCAM и NTSC — это всё системы с чересстрочной развёрткой. Новые цифровые стандарты телевидения, например, HDTV предусматривают прогрессивную развёртку. Хотя появились технологии, позволяющие имитировать прогрессивную развёртку при показе материала с интерлейсом. Чересстрочную развёртку обычно обозначают символом «i» после указания вертикального разрешения, например 720×576i×50 для видео в формате PAL.

Разрешение

По аналогии с разрешением компьютерных мониторов, любой видеосигнал также имеет разрешение (англ. resolution), горизонтальное и вертикальное, измеряемое в пикселях. Обычное аналоговое телевизионное разрешение составляет 720×576 пикселей для стандартов PAL и SÉCAM, при частоте кадров 50 Герц (одно поле, 2×25); и 648×486 пикселей для NTSC, при частоте 60 Герц (одно поле, 2×29,97). В выражении 648×480 первым числом обозначается количество точек в горизонтальной линии (горизонтальное разрешение), а вторым числом количество самих линий (вертикальное разрешение).

Новый стандарт цифрового телевидения высокой четкости (англ. high-definition) HDTV предполагает разрешения до 1920×1080 при частоте мелькания 60 Герц с прогрессивной развёрткой. То есть 1920 пикселей на линию, 1080 линий.

Разрешение в случае трёхмерного видео измеряется в вокселях — элементах изображения, представляющих точки (кубики) в трёхмерном пространстве. Например, для простого трёхмерного видео сейчас используется в основном разрешение 512×512×512, демонстрационные примеры такого видео доступны сегодня даже на PDA.

Соотношение сторон экрана

Соотношение ширины и высоты кадра (англ. aspect ratio) — важнейший параметр в любом видеоматериале. Ещё с 1910 года кинофильмы имели соотношение сторон экрана 4:3 (4 единицы в ширину к 3 единицам в высоту; иногда ещё записывается как 1,33:1 или просто 1,33). Считалось, что зрителю удобнее смотреть фильм на экране такой формы. Когда появилось телевидение, то оно переняло это соотношение и почти все аналоговые телесистемы (и, следовательно, телевизоры) имели соотношение сторон экрана 4:3. Компьютерные мониторы также унаследовали телевизионный стандарт сторон. Хотя ещё в 1950-х годах это представление о 4:3 в корне изменилось. Дело в том, что поле зрения человека имеет соотношение отнюдь не 4:3. Ведь у человека 2 глаза, расположенных на одной горизонтальной линии — следовательно, поле зрения человека приближается к соотношению 2:1. Чтобы приблизить форму кадра к естественному полю зрения человека, усилить восприятие фильма, был введён стандарт 16:9 (1,78), почти соответствующий так называемому «Золотому сечению». Цифровое телевидение в основном тоже ориентируется на соотношение 16:9. К концу XX века, после ряда дополнительных исследований в этой области, стали появляться даже и более радикальные соотношения сторон кадра: 1,85, 2,20 и вплоть до 2,35 (почти 21:9). Всё это, безусловно, призвано глубже, погрузить зрителя в атмосферу просматриваемого видеоматериала.

Количество цветов и цветовое разрешениеосферу просматриваемого видеоматериала.

Количество цветов и цветовое разрешение

Количество цветов и цветовое разрешение видеосигнала описывается цветовыми моделями. Для стандарта PAL применяется цветовая модель YUV, для SÉCAM модель YDbDr, для NTSC модель YIQ, в компьютерной технике применяется в основном RGB (и αRGB), реже HSV, а в печатной технике CMYK. Количество цветов, которое может отобразить монитор или проектор зависит от качества монитора или проектора. Человеческий глаз может воспринять, по разным подсчётам, от 5 до 10 миллионов оттенков цветов. Количество цветов в видеоматериале определяется числом бит, отведённым для кодирования цвета каждого пикселя (англ. bits per pixel, bpp). 1 бит позволяет закодировать 2 цвета (обычно чёрный и белый), 2 бита — 4 цвета, 3 бита — 8 цветов, …, 8 бит — 256 цветов (28 = 256), 16 бит — 65 536 цветов (216), 24 бита — 16 777 216 цветов (224). В компьютерной технике имеется стандарт и 32 бита на пиксель (αRGB), но этот дополнительный α-байт (8 бит) используется для кодирования коэффициента прозрачности пикселя (α), а не для передачи цвета (RGB). При обработке пикселя видеоадаптером, RGB-значение будет изменено в зависимости от значения α-байта и цвета подлежащего пикселя (который станет «виден» через «прозрачный» пиксель), а затем α-байт будет отброшен, и на монитор пойдёт только цветовой сигнал RGB.

Битрейт или ширина видеопотока (для цифрового видео)

Ширина (иначе говорят скорость) видео потока или битре́йт (англ. bit rate) — это количество обрабатываемых бит видеоинформации за секунду времени (обозначается «бит/с» — бит в секунду, или чаще «Мбит/с» — мегабит в секунду; в английском обозначении «bit/s» и «Mbit/s» соответственно). Чем выше ширина видео потока, тем в общем лучше качество видео. Например, для формата VideoCD ширина видео потока составляет всего примерно 1 Мбит/с, а для DVD составляет около 5 Мбит/с. Конечно, субъективно разницу в качестве нельзя оценить как пятикратную, но объективно это так. А формат цифрового телевидения HDTV использует ширину видео потока около 10 Мбит/с. При помощи скорости видео потока также очень удобно оценивать качество видео при его передаче через Интернет.

Различают два вида управления шириной потока в видео кодеке — постоянный битрейт (англ. constant bit rate, CBR) и переменный битрейт (англ. variable bit rate, VBR). Концепция VBR, ныне очень популярная, призвана максимально сохранить качество видео, уменьшая при этом суммарный объём передаваемого видео потока. При этом на быстрых сценах движения, ширина видео потока возрастает, а на медленных сценах, где картинка меняется медленно, ширина потока падает. Это очень удобно для буферизованных видео трансляций и передачи сохранённого видеоматериала по компьютерным сетям. Но для безбуферных систем реального времени и для прямого эфира (например, для телеконференций) это не подходит — в этих случаях необходимо использовать постоянную скорость видео потока.

Качество видео

Качество видео измеряется с помощью формальных метрик, таких, как PSNR или SSIM, или с использованием субъективного сравнения с привлечением экспертов.

Субъективное качество видео измеряется по следующей методике:

Выбираются видеопоследовательности для использования в тесте

Выбираются параметры системы измерения

Выбирается метод показа видео и подсчета результатов измерения

Приглашается необходимое число экспертов (обычно не меньше 15)

Проводится сам тест

Подсчитывается средняя оценка на основе оценок экспертов.

 Несколько методов субъективной оценки описаны в рекомендациях ITU-T BT.500. Один из широко используемых методов оценки — это DSIS (англ. Double Stimulus Impairment Scale), при котором экспертам сначала показывают исходный видеоматериал, а затем обработанный. Затем эксперты оценивают качество обработки, варьируя свои оценки от «обработка незаметна» и «обработка улучшает видеоизображение» до «обработанный видеоматериал сильно раздражает».

Форматы медиаданных

Контейнер (в программировании) - это структура позволяющая инкапсулировать в себя объекты разных типов, в основном они построены на основе шаблонов. Самые распространенные контейнеры - из стандартной библиотеки(STL)-map,vector,..., и библиотек BOOST. В контейнерах часто встречается реализация алгоритмов для них.

Ко́дек (англ. codec — сокр. от coder/decoder (кодировщик/декодировщик) или compressor/decompressor) — устройство или программа, способная выполнять преобразование потока данных или сигнала. Кодеки могут, как кодировать поток/сигнал (часто для передачи, хранения или шифрования), так и раскодировать — для просмотра или изменения в формате, более подходящем для этих операций. Кодеки часто используются при цифровой обработке видео и звука.

Большинство кодеков для звуковых и визуальных данных использует сжатие с потерями, чтобы получать приемлемый размер готового (сжатого) файла. Существуют также кодеки, сжимающие без потерь (англ. lossless codecs), но для большинства применений, малозаметное улучшение качества не оправдывает значительного увеличения объема данных. Почти единственное исключение — ситуация, когда данные будут подвергаться дальнейшей обработке: в этом случае повторяющиеся потери на кодировании/декодировании окажут серьезное влияние на качество.

Фильтрр - специальная подпрограмма, которая обрабатывает отдельные кадры оцифрованного видео для достижения какого–либо эффекта, например: изменение яркости, устранение эффекта чересстрочности, изменение разрешения видео и так далее. фильтр не в состоянии работать самостоятельно: он может использоваться только под управлением программы по обработке видео.

Форматы медиаданных

Видеокодеки

ISO/IEC/ITU-T

Другие

MPEG (1 · 2 · 4) · H.261 · H.262 · H.263 · H.264/MPEG-4 AVC

AVS · Bink · Dirac · Indeo · MJPEG · RealVideo · Theora · VC-1 · VP6 · VP7 · WMV · SIF1

Аудиокодеки

ISO/IEC MPEG

ITU-T

Другие

MP3 · MP2 · AAC · HE-AAC

G.711 · G.722 · G.722.1 · G.722.2 · G.723 · G.723.1 · G.726 · G.728 · G.729 · G.729.1 · G.729a

AC3 · Apple Lossless · ATRAC · FLAC · iLBC · Monkey’s Audio · Musepack · RealAudio · SHN · Speex · Vorbis · WavPack · WMA

Графические форматы

ISO/IEC/ITU-T

Другие

JPEG · JPEG 2000 · JPEG-LS · JBIG · JBIG2

BMP · GIF · ILBM · PCX · PNG (MNG) · TGA · TIFF · WMP

Медиа-контейнеры

Основные

Только аудио

3gp · ASF · AVI · DPX · FLV · Matroska · MP4 · MXF · NUT · Ogg · Ogg Media · OMF · QuickTime · RealMedia

AIFF · RIFF · AU · WAV

Windowss Media

Windows Media — мультимедийный набор от Microsoft для создания и распространения аудио и видеофайлов для Windows. Включает набор средств разработки и интерфейс программирования приложений.

Составляющие Windows Media

Приложения

Windows Media Encoder

Windows Media Player

Windows Media Services

Форматы

Advanced Systems Format (ASF)

Windows Media Audio (WMA)

Windows Media Photo (WDP)

Windows Media Video (WMV)

Advanced Streaming Format (англ. Advanced Streaming Format или Active Streaming Format) - разработанный фирмой Microsoft формат файлов содержащих потоковое аудио и видео. ASF является частью Windows Media. В данный момент формат переименован в Advanced Systems Format.

ASF расширяемый формат, может содержать данные, закодированные при помощи различных кодеков, поддерживает синхронизацию потоков. Формат пригоден как для локального воспроизведения, так и для передачи и воспроизведения по компьютерным сетям, включая Интернет.

ASF является мультимедиа контейнером, и не содержит указаний на то, каким образом данные должны быть закодированы, а только определяет структуру потока данных. В этом отношении ASF заменяет формат мультимедиа контейнеров AVI.

Обычно используемое расширение файла .asf, тип MIME video/x-ms-asf. Кроме того, файлы, содержащие преимущественно аудиоинформацию, могут иметь расширение .wma, а видеофайлы - .wmv, расширение .asf обычно используется для файлов, содержащих данные, закодированные кодеками сторонних (не Microsoft) разработчиков.

Особенности формата

Возможность потокового воспроизведения

Управление приоритетами потоков

Мультиязычность

Расширямость, возможность динамической загрузки компонентов и кодеков

Поддержка DRM

Расширенные возможности аннотирования и использования метаданных

Особенностью формата ASF является возможность воспроизведения непосредственно в момент загрузки данных по сети, то есть потокового воспроизведения. Для передачи по IP сетям ASF потоков обычно используется протокол RTSP.

Для использования данного формата необходимо лицензирование у фирмы Microsoft.

Windows Media Video — название системы видео кодирования, разработанной компанией Microsoft для хранения и трансляции видео-информации. Использует расширение имени файла .wmv. Входит в мультимедийный пакет Windows Media.

Версии

Название

Формат

Microsoft MPEG-4 Video Codec V1

MPG4

Microsoft MPEG-4 Video Codec V2

MP42

Microsoft MPEG-4 Video Codec V3

MP43

Microsoft ISO MPEG-4 Video Codec V1

MP4S

Microsoft ISO MPEG-4 Video Codec V1.1

M4S2

Windows Media Video V7

WMV1

Windows Media Screen V7

MSS1

Windows Media Video V8

WMV2

Windows Media Video 9

WMV3

Windows Media Video 9 Screen

MSS2

Windows Media Video 9.1 Image

WMVP

Windows Media Video 9.1 Image V2

WVP2

Windows Media Video 9 Advanced Profile    

WMVA

Windows Media Video 9 Advanced Profile

WVC1

MPEG

MPEG (англ. Moving Picture Experts Group) — группа специалистов в подчинении ISO, собирающаяся для выработки стандартов сжатия цифрового видео и аудио. Первое собрание происходило в 1988 году в Ганновере.

Официальное обозначение группы ISO/IEC JTC1/SC29 WG11.

MPEG стандартизовала следующие стандарты сжатия и вспомогательные стандарты:

MPEG-1: Исходный стандарт видео и аудио компрессии. Позднее использовался, как стандарт для Video CD, и включает в себя Layer 3 (MP3) формат аудио сжатия.

MPEG-2: Транспортные, видео и аудио стандарты для широковещательного телевидения. Используется в цифровом телевидении ATSC, DVB и ISDB, цифровых спутниковых ТВ службах, таких как Dish Network, цифровом кабельном телевидении , и (с небольшими изменениями) в DVD.

MPEG-3: Изначально разрабатывался для HDTV, но от него отказались, когда обнаружилось, что MPEG-2 (с расширениями) вполне достаточно для HDTV. (Не стоит его путать с MP3, который на самом деле MPEG-1 Layer 3.)

MPEG-4: Расширяет MPEG-1 для поддержки видео/аудио "объектов", 3D контента, сжатия с низким битрейтом и DRM. В него включено несколько новых высоко эффективных видео стандартов (альтернатив MPEG-2 ), особо отметим:

MPEG-4 Part 2 (ASP) и

MPEG-4 Part 10 (или AVC или H.264). MPEG-4 Part 10 может быть использован в HD-DVD и Blu-Ray дисках.

MPEG-1

MPEG-1 означает группу стандартов на цифровое сжатие аудио и видео, принятую MPEG (Moving Picture Experts Group - Группой Экспертов в области Видео). MPEG-1 видео используется в формате Video CD. Качество видео на видео-CD (VCD) приблизительно близко к качеству VHS видеокассет.

MPEG-1 audio layer 3 - это полное имя весьма популярного формата сжатия аудио MP3. С появлением более дешевого и мощного аппаратного обеспечения для кодирования/декодирования были разработаны более совершенные форматы MPEG-2 и MPEG-4. Алгоритмы этих форматов более сложны и требуют больших вычислительных мощностей, однако они позволяют достигнуть большей эффективности кодирования, то есть лучшего соотношения качество/bitrate.

MPEG-1 состоит из нескольких частей:

Синхронизация и мультиплексирование аудио и видео (MPEG-1 Program Stream).

кодек для видео с прогрессивной разверткой.

кодек для звука. Стандарт MPEG-1 определяет три уровня сжатия звука.

MP1 или MPEG-1 часть 3 уровень 1 (MPEG-1 Audio Layer 1)

MP2 или MPEG-1 часть 3 уровень 2 (MPEG-1 Audio Layer 2)

MP3 или MPEG-1 часть 3 уровень 3 (MPEG-1 Audio Layer 3)

Процедуры тестирования производительности.

Эталонное ПО (Reference software).

Ссылка на стандарт: ISO/IEC JTC1/SC29/WG11 http://www.chiariglione.org/mpeg/standards/mpeg-1/mpeg-1.htm

MPEG-1 видео был исходно разработан с целью достичь приемлемого качества для видео на потоках 1.5 Мегабита/c и разрешении 352x240. Несмотря на то, что MPEG-1 применяется для кодирования с низким разрешением и низким bitrate'ом, стандарт позволяет использовать любое разрешение до 4095x4095. Большинство реализаций разработаны с учетом спецификации Constrained Parameter Bitstream.

В настоящее время MPEG-1 - наиболее совместимый формат в семействе MPEG - он проигрывается практически на всех компьютерах с VCD/DVD проигрывателями.

Самым крупным недостатком MPEG-1 видео является поддержка только прогрессивной развертки. Этот недостаток в свое время помог более быстрому признанию более универсального стандарта MPEG-2.

MPEG-2

MPEG-2 — название группы стандартов цифрового кодирования видео и аудио сигналов, одобренных ISO — Международной Организацией по стандартизации/IEC Moving Picture Experts Group (MPEG). Стандарт MPEG-2 в основном используется для кодирования видео и аудио при вещании, включая спутниковое вещания и кабельное телевиление. MPEG-2 с некоторыми модификациями также активно используется как стандарт для сжатия DVD. Использование MPEG-2 требует платить лицензионные отчисления держателям патентов через MPEG Licensing Association.

Сжатие видео

 MPEG-2 используется для общего сжатия движущихся изображений и звука и определяет формат видео-потока, который может быть представлен как три типа кадра — независимо сжатые кадры (I-кадры), кадры сжатые с использованием предсказания движения в одном направлении (P-кадры) и кадры, сжатые с использованием предсказания движения в двух направлениях (B-кадры). Соответствующие группы кадров от одного I-кадра до другого образуют GOP — Group Of Pictures — группу кадров.

Обычно используются потоки в 25 или 29,97 кадров в секунду.

MPEG-2 поддерживает видео и в прогрессивной, и в чересстрочной развертке.

Сжатие аудио

MPEG-2 также определяет новые методы сжатия аудио. Такие как:

сжатие на низких битрейтах с половинным сэмплированием (MPEG-1 Layer 1/2/3 LSF)

многоканальное сжатие до 5.1 каналов

новый стандарт MPEG-2 AAC

Профили и уровни стандарта

MPEG-2 Profiles

Аббр.

Имя

Кадры

YUV

Потоки

Комментарий

SP

Simple Profile

P, I

4:02:00

1

без интерлейсинга

MP

Main Profile

P, I, B

4:02:00

1

 

422P

4:2:2 Profile

P, I, B

4:02:02

1

 

SNR

SNR Profile

P, I, B

4:02:00

1-2

Отношение сигнал/шум

SP

Spatial Profile

P, I, B

4:02:00

1-3

низкое, нормальное и высокое качество декодирования

HP

High Profile

P, I, B

4:02:02

1-3

 

MPEG-2 Levels

Аббр.

Имя

Пикселей/строку

Строк

Кадров/c (Гц)

Битрейт (Мбит/с)

LL

Low Level

352

288

30

4

ML

Main Level

720

576

30

15

H-14

High 1440

1440

1152

30

60

HL

High Level

1920

1152

30

80

 

Profile @ Level

Resolution (px)

Framerate max. (Hz)

Sampling

Bitrate (Mbit/s)

Application

SP@LL

176 × 144

15

4:02:00

0.096

Wireless handsets

SP@ML

352 × 288

15

4:02:00

0.384

PDAs

320 × 240

24

MP@LL

352 × 288

30

4:02:00

4

Set-top boxes (STB)

MP@ML

720 × 480

30

4:02:00

15 (DVD: 9.8)

DVD, SD-DVB

720 × 576

25

MP@H-14

1440 × 1080

30

4:02:00

60 (HDV: 25)

HDV

1280 × 720

30

MP@HL

1920 × 1080

30

4:02:00

80

ATSC 1080i, 720p60, HD-DVB (HDTV)

1280 × 720

60

422P@LL

 

 

4:02:02

 

 

422P@ML

720 × 480

30

4:02:02

50

Sony IMX using I-frame only, Broadcast «contribution» video (I&P only)

720 × 576

25

422P@H-14

1440 × 1080

30

4:02:02

80

Potential future MPEG-2-based HD products from Sony and Panasonic

1280 × 720

60

422P@HL

1920 × 1080

30

4:02:02

300

Potential future MPEG-2-based HD products from Panasonic

1280 × 720

60

 

DVD

Стандарт DVD использует MPEG-2 видео, но определяет некоторые ограничения:

  • Допустимые разрешения

720 × 480, 704 × 480, 352 × 480, 352 × 240 пикселей (NTSC)

720 × 576, 704 × 576, 352 × 576, 352 × 288 пикселей (PAL)

  • Допустимые соотношения ширины к высоте Aspect ratio (Display AR)

4:3

16:9

2.21:1

  • Допустимое число кадров в секунду

29.97 к/с (NTSC)

25 к/с (PAL)

 

DVB

Ограничения на MPEG-2 в стандарте DVB:

Допустимые разрешения для SDTV:

720, 640, 544, 480 or 352 × 480 пикселей, 24/1.001, 24, 30/1.001 or 30 frame/s

352 × 240 пикселей, 24/1.001, 24, 30/1.001 or 30 frame/s

720, 704, 544, 480 or 352 × 576 пикселей, 25 frame/s

352 × 288 пикселей, 25 frame/s

 

Для HDTV:

720 x 576 x 50 кадров/c progressive (576p50)

1280 x 720 x 25 or 50 кадров/c progressive (720p50)

1440 or 1920 x 1080 x 25 кадров/c progressive (1080p25 — film mode)

1440 or 1920 x 1080 x 25 кадров/c interlace (1080i25)

1920 x 1080 x 50 кадров/c progressive (1080p50) possible future H.264/AVC format

 

ATSC

 Допустимые разрешения:

1920 × 1080 пикселей, 30 кадров/c (1080i)

1280 × 720 пикселей, 60 кадров/c (720p)

720 × 576 пикселей, 25 кадров/c (576i, 576p)

720 or 640 × 480 пикселей, 30 кадров/c (480i, 480p)

 

Примечание: 1080i кодируется как 1920 × 1088 кадр, но последние 8 столбцов выбрасываются перед показом на дисплей.

 

MPEG-4

 MPEG-4 — это международный стандарт, используемый преимущественно для сжатия цифрового аудио и видео. Появился он в 1998 году, и включает в себя группу стандартов сжатия аудио и видео и смежные технологии, одобренные ISO — Международной Организацией по стандартизации/IEC Moving Picture Experts Group (MPEG). Стандарт MPEG-4 в основном используется для вещания (потоковое видео), записи дисков с фильмами CD, видеотелефонии (видеотелефон), и широковещания, в которых активно используется сжатие цифровых видео и аудио.

 MPEG-4 включает в себя многие функции MPEG-1, MPEG-2 и других подобных стандартов, добавляя такие функции как поддержка языка виртуально разметки VRML для показа 3D обьектов, обьектно-ориентированные файлы, поддержка управления правами и разные типы интерактивного медиа. AAC (Advanced Audio Codec — или Улучшенный Аудио Кодек) был стандартизован как дополнение к MPEG-2 (часть 7), был также расширен и включен в MPEG-4.

MPEG-4 предоставляет комплект технологий для разработчиков, для различных поставщиков услуг и для конечных пользователей.

MPEG-4 позволяет различным разработчикам создавать объекты, обладающие лучшей адаптивностью и гибкостью при улучшении качества, таких услуг и технологий как цифровое телевидение и мультипликация, WWW и их расширения. Этот стандарт позволяет разработчикам более эффективно управлять контентом и более эффективно бороться против пиратства.

Различные сетевые провайдеры могут использовать MPEG-4 для обеспечения прозрачности данных. С помощью стандартных процедур любые данные могут быть интерпретированы и преобразованы в различные сигналы, которые можно предать по любой существующей сети.

Формат MPEG-4 предоставляет конечным пользователям широкий спектр возможностей, позволяющих взаимодействовать с различными анимированными объектами.

Формат MPEG-4 может позволить выполнять различные функции, среди которых следующие:

Аудио потоки, видео и аудиовизуальные данные могут быть, как естественными, так и искусственно созданными. Это означает, что они могут быть, как записаны на видеокамеру или микрофон, так и созданы с помощью компьютера и специального программного обеспечения.

Мультиплексирование и Синхронизация данных, связанных с медийным объектом, в том смысле, что они могут быть переданы через сетевые каналы.

Взаимодействие с аудио-визуальной сценой, которая формируется на стороне приемника.

H.264, MPEG-4 Part 10, или AVC (Advanced Video Coding) — стандарт сжатия видео, предназначенный для достижения высокой степени сжатия видеопотока при сохранении высокого качества. Он был создан ITU-T Video Coding Experts Group (VCEG) совместно с ISO/IEC Moving Picture Experts Group (MPEG) в рамках совместной программы Joint Video Team (JVT). ITU-T H.264 стандарт и ISO/IEC MPEG-4 Part 10 стандарт (формально, ISO/IEC 14496-10) технически полностью идентичны. Финальный черновой вариант первой версии стандарта был закончен в мае 2003 года.

Используется в цифровом телевидении высокого разрешения (HDTV); как основной кодек для видеозаписей Министерством обороны США, компанией Apple (в том числе видеоролики для плееров iPod) и многих других областях цифрового видео.

Возможности H.264/AVC/MPEG-4 Part 10

Стандарт H.264/AVC/MPEG-4 Part 10 содержит ряд новых возможностей, позволяющих значительно повысить эффективность сжатия видео по сравнению с предыдущими (такими, как ASP) стандартами, обеспечивая также большую гибкость применения в разнообразных сетевых средах. Основные из них:

А) Многокадровое предсказание кадров:

1.Использование сжатых ранее кадров в качестве опорных (т.е. с заимствованием части материала из них) куда более гибко, чем в предыдущих стандартах. Позволяется использование до 32 ссылок на другие кадры, тогда как в ASP и более ранних число ссылок ограничено одним или, в случае B-кадров, двумя кадрами. Это поднимает эффективность кодирования, так как позволяет кодеру выбирать для компенсации движения между большим количеством изображений. Данная функция обеспечивает небольшое улучшение в качестве и экономию битрейта в большинстве сцен. Однако для некоторых сцен, например с частыми повторяющимися участками, возвратно-поступательным движением и т.п. подобный подход при сохранении качества позволяет очень сильно снизить затраты битрейта.

2.Независимость порядка воспроизведения изображений и порядка опорных изображений. В предшествующих стандартах устанавливалась жесткая зависимость между порядком следования изображений для использования при компенсации движения и порядком следования изображений при воспроизведении. В новом стандарте эти ограничения в значительной мере устранены, что позволяет кодеру выбирать порядок изображений для компенсации движения и для воспроизведения с высокой степенью гибкости, которая ограничена только объемом памяти, который гарантирует возможность декодирования. Устранение ограничения также позволяет в ряде случаев устранить дополнительную задержку, ранее связанную с двунаправленным предсказанием.

Независимость методов обработки изображений и возможности их использования для предсказания движения. В предшествующих стандартах изображения, закодированные с использованием некоторых методов (например, двунаправленного предсказания), не могли использоваться в качестве опорных для предсказания движения других изображений видеопоследовательности. Устраняя это ограничение, новый стандарт обеспечивает кодеру большую гибкость и, во многих случаях, возможность использовать для предсказания движения изображение, более близкое по содержанию к кодируемому.

Компенсация движения с переменным размером блока (от 16x16 до 4x4 пикселя) позволяет крайне точно выделять области движения.

Вектора движения, выводящие за границы изображения. В MPEG-2 и предшествовавших ему стандартах вектора движения могли указывать только на пикселы, находящиеся в границах декодированного опорного изображения. Методика экстраполяции за границы изображения, появившаяся как опция в H.263, включена в новый стандарт.

Шеститочечная фильтрация компонента яркости для полупиксельного предсказания с целью уменьшения зубчатости краев и, в конечном счете, обеспечения большей четкости изображения.

Точность до четверти пиксела (Qpel) при компенсации движения обеспечивает очень высокую точность описания движущихся областей (что особенно актуально для медленного движения). Цветность, как правило, хранится с разрешением, уменьшенным вдвое по вертикали и горизонтали (прореживание цвета), поэтому компенсация движения для компонента цветности использует точность в одну восьмую пиксела цветности.

Взвешенное предсказание, позволяющее использовать масштабирование и сдвиг после компенсации движения на величины, указанные кодером. Такая методика может чрезвычайно сильно поднять эффективность кодирования для сцен с изменением освещенности, например при эффектах затемнения, постепенного появления изображения.

Б) Пространственное предсказание от краев соседних блоков для I-кадров (в отличие от предсказания только коэффициента трансформации в H.263+ и MPEG-4 Part 2, и дискретно-косинусного коэффициента в MPEG-2 Part 2). Новая методика экстраполяции краев ранее декодированных частей текущего изображения повышает качество сигнала, используемого для предсказания.

В) Сжатие макроблоков без потерь:

1. Метод представления макроблоков без потерь в PCM, при котором видеоданные представлены непосредственно, позволяющий точно описывать определенные области и допускающий строгое ограничение на количество закодированных данных для каждого макроблока.

2. Улучшенный медод беспотерьного представления макроблоков, позволяющий точно описывать определенные области, при этом обычно затрачивая существенно меньше битов, чем PCM (поддерживается не во всех профилях).

Г) Гибкие функции чересстрочного сжатия (поддерживается не во всех профилях):

1. Адаптивное к изображению кодирование полей (PAFF), позволяющее кодировать каждый кадр как кадр или как пару полей (полукадров) - в зависимости от отсутствия\наличия движения.

2. Адаптивное к макроблокам кодирование полей (MBAFF), использующее позволяющее независимо кодировать каждую вертикальную пару макроблоков (блок 16x32) как прогрессивные или чересстрочные. Позволяет использовать макроблоки 16x16 в режиме разбиения на поля (сравните с 16x8 полумакроблоками в MPEG-2). Почти всегда эффективнее PAFF.

Д) Новые функции преобразования:

1. Точное целочисленное преобразование пространственных блоков 4x4 (концептуально подобное широко известному DCT, но упрощенное и способное обеспечить точное декодирование[1]), позволяющее точное размещение разностных сигналов с минимумом шума, часто возникающего в предыдущих кодеках.

2. Точное целочисленное преобразование пространственных блоков 8x8 (концептуально подобное широко известному DCT, но упрощенное и способное обеспечить точное декодирование; поддерживается не во всех профилях), обеспечивающее большую эффективность сжатия схожих областей, чем 4x4.

3. Адаптивный выбор кодеком между размерами блока 4x4 и 8x8 (поддерживается не во всех профилях).

4. Дополнительное преобразование Адамара, применяемое к дискретно-косинусным коэффициентам основного пространственного преобразования (к коэффициентов яркости,и, в особом случае, цветности) для достижения большей степени сжатия в однородных областях.

Е) Квантование:

1. Логарифмическое управление длиной шага для упрощения распределения битрейта кодером и упрощенного вычисления обратной квантования.

2. Частотно-оптимизированные матрицы масштабирования квантования, выбираемые кодером для оптимизации квантования на основе человеческих особенностей восприятия (поддерживается не во всех профилях).

Ж) Внутренний фильтр деблокинга в цикле кодирования, устраняющий артефакты блочности, часто возникающие при использовании основанных на DCT техниках сжатия изображений.

З) Энтропийное кодирование квантованных коэффициентов трансформации:

1. Context-adaptive binary arithmetic coding (CABAC) - Контекстнозависимое Адаптивное Бинарное Арифметическое кодирование - алгоритм беспотерьного сжатия синтаксических элементов видеопотока на основе вероятности их появления. Поддерживается только в Main Profile и выше. Обеспечивает более эффективное сжатие, чем CAVLC, но требует значительно больше времени на расшифровку.

2. Context-adaptive variable-length coding (CAVLC) - Контекстнозависимое Адаптивное Кодирование с Переменной Длиной Кодового Слова - альтернатива CABAC меньшей сложности. Тем не менее, оно сложнее и эффективнее, чем алгоритмы, применяемые для тех же целей в более ранних технологиях сжатия видео (как правило это алгоритм Хаффмана).

3. Часто используемое, простое и высоко структурированное кодирование словами переменной длины многих элементов синтаксиса, не закодированных CABAC или CAVLC, известное как Exp-Golomb (экспоненциальное кодирование Голомба).

Е) Функции устойчивости к ошибкам:

1. Определение уровня сетевой абстракции (NAL), позволяющее использовать один и тот же синтаксис видео в различных сетевых окружениях, включая наборы параметров последовательности (sequence parameter sets, SPSs) и наборы параметров изображения (picture parameter sets, PPSs), которые обеспечивают большую надежность и гибкость, чем предыдущие технологии.

2. Гибкое упорядочивание макроблоков (FMO), также известное как группы частей (поддерживается не во всех профилях) и произвольное упорядочивание частей (ASO) - методы реструктурирования порядка представления фундаментальных областей (макроблоков) в изображениях. При эффективном использовании гибкое упорядочивание макроблоков может существенно повысить устойчивость к потере данных.

Благодаря ASO, так как каждая часть изображения может быть декодирована независимо от других (при определенных ограничениях кодирования), новый стандарт позволяет посылать и получать их в произвольном порядке друг относительно друга. Это может снизить задержку в приложениях реального времени, особенно при использовании на сетях, имеющих режим работы доставка вне очереди Эти функции могут также использоваться для множества других целей помимо восстановления ошибок.

 Разбиение данных - функция, обеспечивающая разделение данных разной важности (например, вектора движения и другая информация предсказания имеет большую значимость для представления видеоконтента) по разным пакетам данных с разными уровнями защиты от ошибок (поддерживается не во всех профилях).

Избыточные части. Возможность посылки кодером избыточного представления областей изображений, позволяя воспроизвести области изображений (обычно с некоторой потерей качества), данные о которых были потеряны в процессе передачи (поддерживается не во всех профилях).

Нумерация кадров, позволяющая создание "подпоследовательностей" (включая временное масштабирование включением дополнительных кадров между другими) а также обнаружение (и скрытие) потерь целых кадров при сбоях канала или пропаже пакетов.

                                      Аудио-видео контейнеры

Видеозапись состоит из видеоряда, звуковой дорожки (или нескольких), субтитров (возможно, нескольких), текстовых комментариев к ней и т. д. Файл, в который сохраняется видеозапись, имеет специальный формат. Помимо собственно видеоряда и звуковой дорожки он должен содержать служебную информацию, какой формат применён для сжатия видео и звука, так называемый индекс (index, блок данных, который содержит адреса расположения конкретных участков записи — он используется во время перемотки), текстовые описатели (тэги, tags — название записи, автор, информация об авторских правах и прочее). Формат такого файла называют контейнером (container).

Традиционный контейнер для видеозаписей — это AVI (Audio and Video Interleaved).

Любая версия Windows содержит специальную библиотеку (splitter или demultiplexer), которая обеспечивает воспроизведение файлов этого формата.

Если видео записано в другом контейнере - не avi - то вам будет нужна соответствующая программа-splitter, после установки, которой воспроизводить соответствующую запись можно будет любым DirectShow-совместимым проигрывателем. Так, для контейнера OGM (Ogg Media, расширение файла: ogm) splitter можно найти тут: http://tobias.everwicked.com/. Для формата Матрёшка (расширения mkv, mka, mks) - тут: http://matroska.org/downloads/. Для форматов RealMedia и QuickTime также есть Splitter-ы. Некоторые проигрыватели - в частности Media Player Classic - содержат встроенные splitter-ы для некоторых форматов. Также пользуется популярностью Haali Media Splitter, поддерживающий контейнеры Матрёшка и MP4.

Microsoft продвигает формат контейнера для видеозаписей собственной разработки: Windows Media. Такие записи обычно используют метод сжатия видео Windows Media Video (WMV) и Windows Media Audio (WMA) для сжатия звука. Обычно такие файлы имеют расширение asf, wmv или wm. Для воспроизведения таких записей нужно установить или специальный комплект декодеров, или проигрыватель Windows Media Player версии 8 или новее (входит в стандартную установку Windows XP).

В стандарте MPEG–4 есть описание своего контейнера: MP4 (он же используется для HD–DVD). Этот контейнер не уступает по гибкости контейнеру MPEG–2: он поддерживает интерактивные элементы (меню), несколько звуковых дорожек, несколько вариантов субтитров. Сегодня его используют всё чаще. Некоторые программы - например, Moonlight, 3ivX и Nero Digital - обеспечивают поддержку этого контейнера; они же устанавливают в систему DirectShow splitter для этого контейнера, что позволяет воспроизводить такие записи в любом DirectShow - совместимом проигрывателе.

В 6-й версии DivX был внедрён свой формат контейнера - DivX Media, который позволяет интегрировать в видеофайлы меню, несколько звуковых дорожек, несколько вариантов субтитров. Этот формат является модифицированным AVI, причём обратная совместимость сохранена: видеозапись .divx можно воспроизвести любым проигрывателем при помощи стандартного splitter’а AVI (входит в комплект любой версии Windows) и декодера DivX версии 5.2.1 - конечно, без дополнительных возможностей (меню, субтитры); также у проигрывателя должна быть возможность переключать звуковые дорожки (например, Windows Media Player будет воспроизводить все звуковые дорожки одновременно, а Media Player Classic даже корректно отображает язык звуковых дорожек). Чтобы корректно и полностью воспроизводить файлы в формате DivX Media необходимо установить комплект DivX Play Bundle . На сегодня верное воспроизведение таких записей обеспечивают только проигрыватели DivX Player и Windows Media Player (в форуме DivX сказано: многие проигрыватели пока не поддерживают этот формат).

Сжатие

Чтобы уменьшить потери качества, при захвате и монтаже записи используют специальные форматы сжатия: они сохраняют высокое качество даже при повторном применении, обеспечивают простой доступ к любому кадру видеозаписи, но используют очень много памяти. Для хранения видеозаписей применяют другие способы сжатия видео. Такие форматы сжатия используют специальные способы кодирования информации: вместо сохранения каждого кадра сохраняется только информация об изменившихся частях кадра. Это затрудняет доступ к произвольному кадру в видеозаписи, но позволяет достигнуть существенно большего сжатия информации. Также такие способы сжатия сохраняют меньше информации о деталях видеозаписи, что практически незаметно при однократном применении сжатия, но ведёт к появлению очень заметных артефактов при многократном применении такого способа сжатия. Таким образом, при монтаже используются способы сжатия, которые лучше сохраняют качество видеозаписи, но занимают очень большой объём памяти. Для хранения видеозаписей используются другие способы сжатия, которые обеспечивают неплохое качество записи и требуют существенно меньше памяти.

Несжатое видео

Видео в таком виде занимает неоправданно много места. На практике в любительских условиях никто не работает с несжатым видео.

Сжатие видео

Используются разные кодеки - программы, которые позволяют кодировать и декодировать видео, используя какой–либо формат сжатия. Учтите, что «большие» графические редакторы содержат в своём комплекте ряд встроенных кодеков.

Промежуточное сжатие видео

Основные требования к промежуточному сжатию видео это - малое влияние на качество изображения даже при многократном повторном применении (в идеале - сжатие без потерь) и обеспечение простого и быстрого доступа к любому кадру (в идеале - каждый кадр сжимается независимо от других). Выполнение этих требований - залог высокого качества изображения и удобной работы при монтаже и редактировании видео