OPEN MUSIC



открытая музыка
о формате огг













Ogg Vorbis во всей своей красоте

_____________________________________


Говоря о свободной музыке, невозможно не упомянуть о свободных форматах её распространения. Далеко не всем известно, что MPEG-1 Layer 3, более известный как MP3, не является свободным форматом. Патент на этот формат принадлежит Frauenhofer Institut. В своё время разработчики MP3 повторили путь авторов графического формата GIF, однако мы не будем заострять внимание на скандалах, а сконцентрируемся на том, насколько свободный формат Ogg Vorbis в состоянии конкурировать с коммерческими MP3, WMA и т.д. С этой целью мы проведём небольшое исследование.

Итак, постановка задачи следующая: провести несколько тестов на предмет выявления достоинств и недостатков обоих форматов. Главный принцип - никакой демагогии, только цифры и графики, ну, немного комментариев и резюме. Условия тестовых замеров: из памяти выгружаются все программы, использующие смежные звуковые библиотеки.

Аппаратное обеспечение: что бог послал, а именно:

  • Процессор - 200 ММХ
  • RAM - 64 Мб
  • Звуковая карта - Creative SB Live 5.1

Итак, начали ...

Тест первый. Компрессия данных.

Тестовый файл - Jeux de vagues из La Mer Дебюсси. Длительность композиции - 6.32. Размер исходного wav-файла - 67463 Кб. Битрейт - 128 Кб/сек. 16-битный звук. Частота выборки - 44.100 КГц. Размер используемой памяти взят по top.

Кодек Длительность Съедаемая память на 25% кодирования Съедаемая память на 75% кодирования Размер конечного файла
lame 7:10 1388 1388 6.266 Мб
oggenc 15:48 2904 4442 5.871 Мб

Теперь увеличиваем битрейт вдвое и получаем следующие данные:

Кодек Длительность Съедаемая память на 25% кодирования Съедаемая память на 75% кодирования Размер конечного файла
lame
4:25
1376
1382
12239 Мб
oggenc
15:00
4656
5090
12256 Мб

Комментарий. Как при низком, так и при высоком битрейте кодирование в mp3 проходит быстрее, однако результируемый файл часто занимает меньше дискового пространства, если он скомпрессирован в ogg vorbis.

Тест второй. Проигрывание данных.

Тестировались все четыре скомпрессированных файла, полученные в ходе предыдущего теста. Вот результаты теста на проигрывание:

Кодек
25%. 128 Кб/сек
25%. 256 Кб/сек
75%. 128 Кб/сек
75%. 256 Кб/сек
lame
1926
3560
5288
10380
oggenc
1840
1884
1892
1994


Тест третий. Замеры диапазона частот.

Как известно, основным принципом компресии аудиоданных является усекновение слабых сигналов, неразличимых или плохо различимых (это ключевое слово) на фоне сильных. Очевидно, что в абсолютном большинстве "под нож" попадает высокочастотный спектр. Это абсолютно официально признают разработчики MP3, которые для упрощения задачи попросту вырезают весь спектр частот выше 15 КГц. То, что при этом результат именуется ими запись с качеством CD, оставим на их совести, поскольку частотный диапазон на CD всё-таки повыше, притом немало.

Чем это реально грозит слушателю? Здесь всё зависит от типа музыки. Если предполагается напористый рок или блюз, играемый на барабанах, перкуссии, бас-гитаре и гитаре-соло плюс вокал, то верхняя планка используемых частот будет редко вызодить за пределы 12 КГц, и здесь такой шаг оправдан. То же относится к дискотечной электронной музыке.

Однако реальные проблемы начинаются при компрессии классической музыки и сложной электронной музыки a-la Klaus Schulze. Во-первых, обертоны   ряда струнных инструментов попадают в отрезанный диапазон, что автоматически искажает их звучание. Во-вторых, по причине упомянутого основного принципа компрессии "под нож" также может попасть изрядное количество реверберационных данных. Реверберация - это эффект постепенного затухания сигнала, отражающегося от стенок помещения. При отражении сигнала происходит эффект эха. А теперь представьте себе, что кодек урезал часть затухающего сигнала, который, по его мнению, уху слушателя уже недоступен. Представление слушателя о пространстве исказится и целостнось восприятия будет нарушена, не так ли? Другой пример: один из известнейших пианистов мира имеет привычку напевать играемую им мелодию, но услышано это может быть только при очень внимательном прослушивании. Как вы думаете, что произойдёт с вокальными потугами маэстро при компрессировании композиции? Иными словами, проблема в том, что мнение слушателя может не совпадать с мнением авторов кодека для сжатия аудиосигнала, поэтому в жертву качеству звука начинает приноситься дисковое пространство.

Решаться подобные проблемы могут двумя путями - использованием большего битрейта, либо использованием другого кодека с другой, более совершенной психоакустической моделью. Вот и давайте посмотрим на то, как OggVorbis будет справляться с частотным диапазоном в сравнении с MP3 при помощи спектрограмм, построеннных в Audacity.

оригинал

mp3, 128 Кбит/сек

ogg vorbis, 128 Кбит/сек


Комментарий: при низком битрейте преимущество ogg vorbis очевидно. Не стоит забывать при этом о том, что размер компрессированного в ogg vorbis файла при этом заметно меньше аналога в mp3.


оригинал

mp3, 256 Кбит/сек

ogg vorbis, 256 Кбит/сек


При высоком битрейте разница в сохранённом диапазоне частот практически незаметна - Ogg Vorbis и MP3 идут ноздря в ноздрю, но всё же отстают от оригинала.

Интересная деталь: при попытке синхронно проиграть оригинал в wav и компрессированный вариант в MP3 в одном проекте Audacity провалилась: треки попросту не совпадали, что вызывало своего рода эффект chorus. С импортированным в проект файлом формата Ogg Vorbis такой проблемы не было.

И вот какие можно сделать выводы.

  1. Тем, кому важнее скорость компрессирования, больше подойдёт lame и формат MP3. Тем, кому важнее качество и дисковое пространство - Ogg Vorbis. Результаты тестов это подтверждают.
  2. Тем кому не нужно больше двух аудиоканалов, можно при отсутствии другой мотивации для выбора остановиться на MP3. Ogg Vorbis поддерживает до 255 каналов. Комментарии излишни.

Немного эмпирики: музыка, скомпрессированная в Ogg Vorbis, звучит как-то мягче, к тому же обращение к памяти при проигрывании меньше, чем у MP3, поэтому использование Ogg Vorbis позволяет избежать характерного треска и пауз при проигрывании, свойственных старым компьютерам и компьютерам, перегруженным задачами (а последнее весьма существенно для любителей открывать по двадцать окон разных приложений).

Александр Прокудин, techwriter at tamb.ru