Говоря о свободной музыке, невозможно не упомянуть о свободных форматах
её распространения. Далеко не всем известно, что MPEG-1 Layer 3, более известный
как MP3, не является свободным форматом. Патент на этот формат принадлежит
Frauenhofer Institut. В своё время разработчики MP3 повторили путь авторов
графического формата GIF, однако мы не будем заострять внимание на скандалах,
а сконцентрируемся на том, насколько свободный формат Ogg Vorbis в состоянии
конкурировать с коммерческими MP3, WMA и т.д. С этой целью мы проведём небольшое
исследование.
Итак, постановка задачи следующая: провести несколько тестов на предмет
выявления достоинств и недостатков обоих форматов. Главный принцип - никакой
демагогии, только цифры и графики, ну, немного комментариев и резюме. Условия
тестовых замеров: из памяти выгружаются все программы, использующие смежные
звуковые библиотеки.
Аппаратное обеспечение: что бог послал, а именно:
- Процессор - 200 ММХ
- RAM - 64 Мб
- Звуковая карта - Creative SB Live 5.1
Итак, начали ...
Тест первый. Компрессия данных.
Тестовый файл - Jeux de vagues из La Mer Дебюсси. Длительность композиции
- 6.32. Размер исходного wav-файла - 67463 Кб. Битрейт - 128 Кб/сек. 16-битный
звук. Частота выборки - 44.100 КГц. Размер используемой памяти взят по top.
Кодек |
Длительность |
Съедаемая память на 25% кодирования |
Съедаемая память на 75% кодирования |
Размер конечного файла |
lame |
7:10 |
1388 |
1388 |
6.266 Мб |
oggenc |
15:48 |
2904 |
4442 |
5.871 Мб |
Теперь увеличиваем битрейт вдвое и получаем следующие данные:
Кодек |
Длительность |
Съедаемая память на 25% кодирования |
Съедаемая память на 75% кодирования |
Размер конечного файла |
lame
|
4:25
|
1376
|
1382
|
12239 Мб
|
oggenc
|
15:00
|
4656
|
5090
|
12256 Мб
|
Комментарий. Как при низком, так и при высоком битрейте кодирование
в mp3 проходит быстрее, однако результируемый файл часто занимает меньше
дискового пространства, если он скомпрессирован в ogg vorbis.
Тест второй. Проигрывание данных.
Тестировались все четыре скомпрессированных файла, полученные в ходе предыдущего
теста. Вот результаты теста на проигрывание:
Кодек
|
25%. 128 Кб/сек
|
25%. 256 Кб/сек
|
75%. 128 Кб/сек
|
75%. 256 Кб/сек
|
lame
|
1926
|
3560
|
5288
|
10380
|
oggenc
|
1840
|
1884
|
1892
|
1994
|
Тест третий. Замеры диапазона частот.
Как известно, основным принципом компресии аудиоданных является усекновение
слабых сигналов, неразличимых или плохо различимых (это ключевое
слово) на фоне сильных. Очевидно, что в абсолютном большинстве "под нож"
попадает высокочастотный спектр. Это абсолютно официально признают разработчики
MP3, которые для упрощения задачи попросту вырезают весь спектр частот выше
15 КГц. То, что при этом результат именуется ими запись с качеством CD, оставим
на их совести, поскольку частотный диапазон на CD всё-таки повыше, притом
немало.
Чем это реально грозит слушателю? Здесь всё зависит от типа музыки. Если
предполагается напористый рок или блюз, играемый на барабанах, перкуссии,
бас-гитаре и гитаре-соло плюс вокал, то верхняя планка используемых частот
будет редко вызодить за пределы 12 КГц, и здесь такой шаг оправдан. То же
относится к дискотечной электронной музыке.
Однако реальные проблемы начинаются при компрессии классической музыки
и сложной электронной музыки a-la Klaus Schulze. Во-первых, обертоны ряда
струнных инструментов попадают в отрезанный диапазон, что автоматически искажает
их звучание. Во-вторых, по причине упомянутого основного принципа компрессии
"под нож" также может попасть изрядное количество реверберационных данных.
Реверберация - это эффект постепенного затухания сигнала, отражающегося от
стенок помещения. При отражении сигнала происходит эффект эха. А теперь
представьте себе, что кодек урезал часть затухающего сигнала, который, по
его мнению, уху слушателя уже недоступен. Представление слушателя о пространстве
исказится и целостнось восприятия будет нарушена, не так ли? Другой пример:
один из известнейших пианистов мира имеет привычку напевать играемую
им мелодию, но услышано это может быть только при очень внимательном прослушивании.
Как вы думаете, что произойдёт с вокальными потугами маэстро при компрессировании
композиции? Иными словами, проблема в том, что мнение слушателя может не
совпадать с мнением авторов кодека для сжатия аудиосигнала, поэтому в жертву
качеству звука начинает приноситься дисковое пространство.
Решаться подобные проблемы могут двумя путями - использованием большего
битрейта, либо использованием другого кодека с другой, более совершенной
психоакустической моделью. Вот и давайте посмотрим на то, как OggVorbis будет
справляться с частотным диапазоном в сравнении с MP3 при помощи спектрограмм,
построеннных в Audacity.
оригинал
|
|
mp3, 128 Кбит/сек
|
|
ogg vorbis, 128 Кбит/сек
|
|
Комментарий: при низком битрейте преимущество ogg vorbis очевидно. Не стоит
забывать при этом о том, что размер компрессированного в ogg vorbis файла
при этом заметно меньше аналога в mp3.
оригинал
|
|
mp3, 256 Кбит/сек
|
|
ogg vorbis, 256 Кбит/сек
|
|
При высоком битрейте разница в сохранённом диапазоне частот практически незаметна
- Ogg Vorbis и MP3 идут ноздря в ноздрю, но всё же отстают от оригинала.
Интересная деталь: при попытке синхронно проиграть оригинал в wav и компрессированный
вариант в MP3 в одном проекте Audacity провалилась: треки попросту не совпадали,
что вызывало своего рода эффект chorus. С импортированным в проект файлом
формата Ogg Vorbis такой проблемы не было.
И вот какие можно сделать выводы.
- Тем, кому важнее скорость компрессирования, больше подойдёт lame и
формат MP3. Тем, кому важнее качество и дисковое пространство - Ogg Vorbis.
Результаты тестов это подтверждают.
- Тем кому не нужно больше двух аудиоканалов, можно при отсутствии другой
мотивации для выбора остановиться на MP3. Ogg Vorbis поддерживает до 255
каналов. Комментарии излишни.
Немного эмпирики: музыка, скомпрессированная в Ogg Vorbis, звучит как-то
мягче, к тому же обращение к памяти при проигрывании меньше, чем у MP3, поэтому
использование Ogg Vorbis позволяет избежать характерного треска и пауз при
проигрывании, свойственных старым компьютерам и компьютерам, перегруженным
задачами (а последнее весьма существенно для любителей открывать по двадцать
окон разных приложений).
Александр Прокудин, techwriter at tamb.ru