Амплитудная модуляция (AM) долгое время доминировала в радиовещании, однако замирание принимаемого сигнала, вносимые искажения и шум значительно снижали качество приема. Эти проблемы были значительно устранены с введением частотной модуляции (FM), что дало возможность передавать стереозвук по качеству сравнимым с качеством CD audio, однако аналоговое радио все еще не лишено дефектов влияния канала связи и ограниченной зоны покрытия. В 2003 году два коммерческих стартапа XM и Sirius (они объединились и стали называться SiriusXM™) представили в США на большой площади систему цифрового спутникового радиовещания по подписке с моделью доходов, аналогичной модели каналов платного телевидения Pay-TV. Одновременно WorldSpace Radio запустило спутниковое широковещание на Азию и Африку.
Система Satellite Digital Audio Radio Services (SDARS) дала возможность слушателям в автомобилях настроиться на прием одной и той же радиостанции в любом месте карты покрытия спутника. Перерыв в приеме возможен только из-за ограничений на местности, когда сигнал блокируется стенами зданий, густой листвой деревьев или туннелями. XM satellite radio взяло на себя ведущую роль в устранении таких блокировок, устанавливая наземные ретрансляторы сигнала спутникового радио в плотно застроенных городских районах, с созданием гибридной архитектуры спутникового и наземного вещания.
В то же самое время традиционные вещатели эфира также нацелились на освоение цифрового вещания - по двум причинам. Во-первых они поняли, что срок их жизни на аналогом вещании в перспективе будет довольно коротким, поскольку мир мигрирует на дорогу повышения качества вещания с помощью цифровых технологий. Во-вторых, спектр частот становится дефицитным ресурсом, поэтому дополнительный контент в пределах одной полосы пропускания может быть доставлен только путем оцифровки и сжатия старого и нового контента, упаковки его в цифровой протокол и последующей трансляции. Таким образом, мировое вещание начало мигрировать с аналогового на цифровое радио. Эти техники радиовещания имеют такие достоинства, как чистый прием, расширенную область покрытия вещанием и возможностью упаковки большего количества контента и информации в существующую полосу частот. Параллельно повышается гибкость доступа к управлению прослушиванием передаваемых программ (см. рис. 1).
Рис. 1. Обработка цифрового радио на DSP.
[DSP в цифровом радио]
Типовая цифровая система передачи (рис. 2) преобразует аналоговый сигнал в цифровой, сжимает его, добавляет коды коррекции ошибок и генерирует из нескольких сигналов пакеты таким образом, чтобы самым лучшим образом использовать емкость (полосу пропускания) канала связи. Для передачи сигналов на частотах RF (которые существуют в "реальном" мире аналоговой энергии), цифровой сигнал преобразуется в аналоговый, и модулирует несущую частоту, излучаемую в эфир. На стороне приема реализуется обратный процесс, начинающийся с демодуляции несущей. Демодулированный сигнал преобразуется в цифровую форму, проверяется на ошибки и распаковывается. Далее цифровые выборки звука преобразуются в аналоговый сигнал, который можно воспроизвести традиционными методами.
Рис. 2. Программная архитектура цифрового радио.
Алгоритмы обработки сигнала в цифровом приемнике можно классифицировать на следующие категории:
• Декодирование канала. • Декодирование исходного сигнала. • Пост-обработка звука. • Дополнительное сервисное ПО (Middleware). • Интерфейс пользователя (MMI).
В цифровом радио кодирование исходного сигнала и кодирование канала относятся соответственно к компонентам эффективного аудиокодека (кодер-декодер выборок звука, наподобие MP3) системе управления ошибками (их коррекции). На практике управление ошибками может быть реализовано более эффективно, если кодек разработан с устойчивостью к ошибкам.
Идеальный канальный кодер должен быть нечувствителен к ошибкам передачи. Идеальный кодер исходника должен сжимать сообщение так, что результирующий сигнал будет максимально похож на случайный шум (энтропия Шеннона). Однако сильно сжатые сообщения приводят к очень большим искажениям звука, если поток данных содержит ошибки. Таким образом, эффективное кодирование исходного сигнала также должно гарантировать, что декодер сможет детектировать ошибки в потоке и скрывать их влияние на качество звука, чтобы оно на слух не ухудшалось.
DRM применяет соответствующие технологические новшества в кодировании источников и канальном кодировании для обеспечения лучшего звукового опыта. Выбранный алгоритм кодирования источника звука DRM обеспечивает:
• Эффективное кодирование - высокое качество звука сочетается со пониженной скоростью передачи бит. • Повышенная устойчивость к ошибкам — применение эстетической деградации при ошибках передачи.
[Эффективное кодирование источника звука]
Технологию Motion Picture Experts Group (MPEG) можно рассматривать в качестве основы для эффективного сотрудничества научных, промышленных и технологических форумов. Успех таких совместных разработок в области компрессии звука, как MPEG Layer II, MP3 и AAC (advanced audio coding) для вещания и хранения/распространения звуковой информации побудило отрасль участвовать в дальнейших инициативах для разработки. MP3 все еще остаются самым популярным "неофициальным" форматом для распространения аудиофайлов через WEB и сохранения их на цифровых носителях данных, однако простые нормы лицензирования — и решение компании Apple принять AAC в качестве медийной платформы для iPod — помогли привлечь к AAC больше внимания в индустрии, чем к MP3.
Рассмотрим AAC из набора протоколов MPEG, чтобы лучше разобраться в некоторых важных технологиях, используемых в кодировании исходного источника звука. Психоакустическая модель (рис. 3) и time-domain alias cancellation (TDAC) можно считать как два прорывных нововведения в кодировании широкополосного звука.
Рис. 3. Принцип работы психоакустического тонального маскирования.
Технологии репликации полосы спектра (Spectral Band Replication, SBR, рис. 4) и пространственного аудиокодирования (spatial audio coding) или бинауральное кодирование (binaural cue coding) стали другими инновациями, поменявшими правила игры. Эти две ключевые инновации дополнительно расширили технологии AAC, чтобы обеспечить масштабируемую производительность кодирования, что привело к стандартизации HE-AAC v2 и MPEG surround и стало широко применяться в отрасли. Продвигаемые индустрией стандарты наподобие Dolby®, AC3 и WMA® также предприняли аналогичные шаги для введения подобных инновация в свои обновленные протоколы кодирования.
Рис. 4. AAC-LR, SBR и PS в декодировании звука.
Утилита замены диапазона спектра (Spectral Band Replacement, SBR) удваивает декодированную частоту выборок по отношению к частоте выборок AAC-LC. Утилита параметрического стерео (parametric stereo, PS) декодирует стереозвук из монофонического потока LC.
Как и любые другие инициативы по улучшению, измерительные технологии также играли свою роль в улучшении качества звука. Инструменты и стандарты оценки качества звука, такие как perceptual evaluation of audio quality (PEAQ) и multi-stimulus with hidden reference and anchor (MUSHRA), оказали содействие ускоренной оценке в технологических экспериментах.
[Незаметная деградация, устойчивость к ошибкам]
В общем случае более высокое сжатие приведет к большему количеству аудиоартефактов при заданном уровне ошибок потока. Например, поток MPEG Layer II более устойчив к ошибкам, чем поток AAC. Однобитная ошибка в части данных спектра Layer II не будет создавать каких-либо раздражающих эффектов, так как максимальное спектральное значение определяется значением распределения битов. Однако в случае AAC та же самая однобитная ошибка приведет к отказу декодера Хаффмана и применению маскирования ошибок фреймов; повторяющиеся ошибки кадров отключат звук до тех пор, пока частота появления ошибок не уменьшится до минимума. Такое длительное молчание мешает системе гарантировать изящную деградацию.
Технология кодирования с устойчивостью к ошибкам Error Resilience (ER) AAC гарантирует изящную деградацию в случае ошибок битового потока с помощью дополнительных инструментов:
• HCR (Huffman Codeword Reordering): предотвращает распространение ошибок в спектральных данных путем деления этих данных на сегменты фиксированного размера. HCR помещает самые важные данные в начало каждого сегмента. • VCB11 (Virtual CodeBooks для codebook 11): детектирует серьезные ошибки в спектральных данных с помощью специального отображения кодового слова. • RVLC (Reversible Variable Length Coding): позволяет избежать распространения ошибок в данных коэффициента масштабирования.
Функции ER-AAC, вместе с UEP, обеспечивают адекватные характеристики устойчивости к ошибкам для DRM.
[Спецификация DRM]
Digital Radio Mondiale (DRM) это открытый стандарт от института ETSI (European Telecommunication Standards Institute), предназначенный для передачи узкополосного звука в диапазонах коротких и средних волн. Хотя DRM поддерживает полосы частот 4.5 кГц, 5 кГц, 9 кГц, 10 кГц, 18 кГц и 20 кГц с 4 режимами передачи и приема, полоса и скорость бит должны быть ограничены 10 кГц и 24 kbps соответственно, если необходима совместимость с существующими стандартами AM.
Таблица 1. Полосы пропускания и скорость бит DRM.
Полоса на 30 МГц |
Полоса (кГц) |
Битрейт (kbps) |
Номинальная (Nominal BW) |
9 .. 10 |
8 .. 20 |
Половинная (Half BW) |
4.5 .. 5 |
2 .. 4 |
Двойная (Double BW) |
18 .. 20 |
20 .. 80 |
Поддержка параметров DRM потребовало использования высокоэффективного аудиокодирования: Meltzer-Moser MPEG-4 HE-AAC v2 (International Standardization Organization/International Electrotechnical Commission—ISO/IEC) было хорошим выбором, но устойчивость к замиранию на канале сделала устойчивую к ошибкам версию HE-AAC v2 (Martin Wolters, 2003) лучшим выбором.
Таблица 2. Различные кодеки, поддерживаемые DRM.
Битрейт (kbps) |
20 .. 80 |
8 .. 20 |
2 .. 4 |
Кодек |
AAC |
CELP |
8 .. 20 |
Скорость бит звука |
12, 24 или 48 |
8 .. 16 |
2 или 4 |
SBR |
ДА |
ДА |
ДА |
PS |
ДА |
- |
- |
Double BW |
ДА |
ДА |
ДА |
Кроме AAC, стандарт DRM определяет кодеки HVXC (Harmonic Vector Excitation Coding) и CELP (Code-Excited Linear Prediction) для использования в передаче голоса. Стриминг сырых данных для слайдшоу картинок, страниц HTML и т. п. также поддерживается стандартом DRM.
Архитектура DRM. Система DRM включает 3 основные пути передачи: основной служебный канал (main service channel, MSC), канал описания службы (service description channel, SDC) и канал быстрого доступа (fast-access channel, FAC). FAC переносит свойства мультиплексированного сигнала с ортогональным частотным распределением (orthogonal frequency-division multiplexed, OFDM) и конфигурацию SDC/MSC - и ограничена скоростью передачи 72 бита на фрейм. SDC содержит информацию, необходимую для декодирования MSC, такую как структуру мультиплексирования фреймов, и другую информацию.
Рис. 5. Мультиплексирование и канальное кодирование в DRM.
MSC кодирует фрейм, генерируемый мультиплексором. Можно выбрать между стандартным отображением, симметричным иерархическим отображением или смешанным иерархическим отображением. MSC использует неравную защиту от ошибок UEP (unequal error protection, см. рис. 6), в котором кадо мультиплексора разделен на 2 части с разными уровнями защиты: одна часть с более высоким уровнем защиты, другая часть с более низким уровнем защиты.
Рис. 6. Unequal Error Protection (UEP) в DRM.
[Цифровое радио на процессорах Blackfin]
Процессор Blackfin® (рис. 7) компании Analog Devices (ADI) отлично подходит как для цифровой обработки сигналов (DSP), так и для традиционного функционала микроконтроллера. В частности, семейство ADSP-BF5xx подходит для приложений цифрового радио, и одновременно снабжено богатым набором встроенных периферийных устройств. Доступность аппаратных и программных средств разработки от сторонних производителей, а также референсные разработки делают платформу Blackfin идеальным выбором для реализации широкого спектра устройств.
Рис. 7. Система цифрового радио на процессоре Blackfin.
В дополнение к созданию необходимой экосистеме и различных программных модулей, ADI также создало свои собственные библиотеки декодирования цифрового радио. Один из таких ключевых компонентов декодер HE-AAC v2, который оптимизирует производительность, доступную из большого количества требуемых единиц MIPS.
[Архитектура декодера HE-AAC V2]
Компоненты декодера HE-AAC v2 (рис. 8) комбинируются для формирования декодера исходного сигнала DRM. Декодер MPEG-4 HE-AAC v2 (который может поддерживать стандарты ETSI DAB и DRM) комбинирует advanced audio coding (AAC), spectral band replication (SBR) и parametric stereo (PS). Декодер поддерживает обратную совместимость с AAC-LC.
Рис. 8. Декодер MPEG-4 HE-AAC v2.
Ключевые функции декодера:
• Масштабируемый декодер MPEG-4 ER-AAC, который может обработать 960 выборок на фрейм. • Поддержка AAC-LC/HE-AAC v1/v2/DRM/DAB. • Поддержка маскирования ошибок. • Поддержка DRC. • Высокая оптимизация по памяти и производительности (MIPS). • Проверка на соответствие полному набору векторов ISO/DAB/DMB и ETSI.
Таблица 3. Производительность декодирования MPEG-4 HE-AAC v2.
Память (кбайт) |
Код |
Таблица |
Данные |
MIPS |
DAB |
115 |
61 |
182 |
8 .. 20 |
DRM |
115 |
62 |
182 |
2 или 4 |
Декодер реализует все необходимые инструменты кодирования звука, указанные в стандарте, включая:
• Более высокое частотное разрешение и эффективность кодирования благодаря MDCT/TDAC. • Адаптивное переключение блоков снижает предварительное эхо. • Нелинейное квантование. • Кодирование Хаффмана. • Использование оконной функции, производной от Kaiser-Bessel, для устранения утечки спектра. • Переменный размер фрейма улучшает выделение бит для данных. • Инструменты IS/MS stereo/TNS и PNS. • Spectral band replication (SBR). • Parametric stereo (PS).
Типовые результаты тестирования цифрового радио представлены в таблице 4.
Таблица 4. Результаты тестирования цифрового радио.
Параметр |
Результаты |
Чувствительность |
40 dB |
Half BW |
На 5 dB лучше, чем MRR |
Интермодуляция |
> 57 dB |
Динамический диапазон |
На 25 dB больше, чем MRR |
Подстройка подавления по соседнему каналу |
MRR +5 dB на ±10 кГц |
Смещение принимаемой частоты |
На 400 Гц лучше, чем MRR |
Рабочее напряжение |
От 6.5V до 12V |
Компания Analog Devices, Inc. (ADI) была самым ранним участником разработки реализации цифрового радио и проведения полевых испытаний референсных разработок. Основанное на процессоре Blackfin радио DRM было одной из первых разработок, удовлетворяющих минимальным требованиям к приемнику, предусмотренным стандартами DRM.
[Словарик]
AAC Advanced Audio Coding, название кодека для цифрового звука.
ADI Analog Devices, Inc., производитель процессоров и микросхем.
AOT Audio Object Type,
BW BandWidth, полоса пропускания по частотам.
CELP Code-Excited Linear Prediction, алгоритм кодирования речи, первоначально предложенный Манфредом Шрёдером и Б. С. Аталом в 1985 году. В то время алгоритм обеспечивал значительно лучшее качество, чем существовавшие тогда алгоритмы с низким битрейтом, такие, как аудиокодеки RELP и LPC (например, FS-1015). Наряду с вариантами, как, например, ACELP, RCELP, LD-CELP и VSELP, на сегодня это наиболее широко используемый алгоритм кодирования речи. CELP в настоящее время используется как общий термин для класса алгоритмов, а не для определенного кодека (из Википедии).
DAB Digital Radio Broadcasting, стандарт для цифрового радиовещания. Используется во многих странах, кроме Северной Америки, где для цифрового радио используется стандарт HD Radio. DAB первоначально разрабатывался в Европе, в 1980 годах. Компания Norwegian Broadcasting Corporation (NRK) запустила первый канал DAB 1 июня 1995 года (NRK Klassisk). BBC и Swedish Radio (SR) запустили свои первые вещательные каналы DAB 27 сентября 1995 года. Приемники DAB доступны во многих странах с конца 1990 годов (из Википедии).
DRM Digital Radio Mondiale, открытый стандарт цифрового радиовещания.
DSP Digital Signal Processing, цифровая обработка сигнала (ЦОС).
HCR Huffman Codeword Reordering, средство изменения порядка кодовых слов Хафмана.
MIPS Million Instructions Per Second - величина, показывающая число миллионов инструкций, выполняемых процессором за одну секунду во время некоторого искусственного (синтетического) теста.
MMI Multi-Media Interface, интерфейс пользователя при потреблении звукового и телевизионного контента.
MOS Mean Opinion Score, методология
MRR Multi Role Radio, стандарт модульного радиовещания, поддерживающий высокоскоростные скачки частоты и усиленное шифрование. Был введен в эксплуатацию в середине 1995 года, работает в диапазоне военных частот VHF от 30.000 до 87.975 МГц (из Википедии).
MUSHRA MUlti-Stimulus with Hidden Reference and Anchor, методология проведения теста прослушивания кодека для оценки воспринимаемого качества выходных данных алгоритмов сжатия с потерями. Была определена рекомендацией ITU-R BS.1534-3. Методология MUSHRA рекомендована для оценки "звука среднего качества". Вместо этой методологии для очень маленьких помещения рекомендуется использовать ITU-R BS.1116-3 (ABC/HR). Основное достоинство методологии MUSHRA перед методологией MOS (используемой для тех же целей) в том, что MUSHRA требует меньшее количество участников для получения статистически значимых результатов. Причина в том, что все кодеки представлены одновременно, на одинаковых семплах, чтобы для статистического анализа парный t-тест можно было использовать для повторного дисперсионного анализа измерений. Шкала 0 .. 100, используемая MUSHRA, делает возможным оценивать качество с очень малыми отличиями (из Википедии).
HVXC Harmonic Vector Excitation Coding, алгоритм кодирования речи, указанный в стандарте MPEG-4 Part 3 (MPEG-4 Audio), применяется для очень низкого битрейта кодирования речи. HVXC поддерживает битрейты 2 и 4 кбит/с с режиме фиксированного и переменного битрейта и частотой дискретизации 8 кГц. HVXC также работает на более низких битрейтах, таких как 1.2 - 1.7 кбит/с, используя технику переменного битрейта. Общая алгоритмическая задержка для кодера и декодера составляет 36 мс (из Википедии).
OFDM orthogonal frequency-division multiplexed, мультиплексирование с ортогональным частотным разделением каналов - цифровая схема модуляции, которая использует большое количество близко расположенных ортогональных поднесущих. Каждая поднесущая модулируется по обычной схеме модуляции (например, квадратурная амплитудная модуляция) на низкой символьной скорости, сохраняя общую скорость передачи данных, как и у обычных схем модуляции одной несущей в той же полосе пропускания. На практике сигналы OFDM получаются применением обратного БПФ (из Википедии).
PEAQ Perceptual Evaluation of Audio Quality, стандартизованный алгоритм объективного измерения качества звука, разработанный в 1994-1998 годах группой экспертов Task Group 6Q организации International Telecommunication Union's Radiocommunication Sector (ITU-R). Изначально был выпущен как ITU-R Recommendation BS.1387 в 1998 году и далее был обновлен в 2001 году. Использует программное обеспечение для моделирования перцептивных свойств человеческого уха, и затем интегрирует несколько выходных переменных модели в единую метрику качества. PEAQ характеризует воспринимаемое качество звука в соответствии с ITU-R BS.1116. Результаты PEAQ в основном моделируют средние оценки мнений по шкале от 1 плохо до 5 отлично (из Википедии).
PS Parametric Stereo, алгоритм компрессии звука с потерями качества, и функция Audio Object Type (AOT), определенный и используемый в MPEG-4 Part 3 (MPEG-4 Audio) для дальнейшего улучшения эффективности на низкой полосе кодирования стереозвука. Advanced Audio Coding Low Complexity (AAC LC), комбинированный со Spectral Band Replication (SBR) и Parametric Stereo (PS) был определен как HE-AAC v2. Декодер HE-AAC v1 дает только монофонический звук, когда декодирует битовый поток HE-AAC v2. Parametric Stereo выполняет разреженное кодирование в пространственной области, в некоторой степени сходное с тем, что SBR делает в частотной области (из Википедии).
RVLC Reversible Variable Length Coding, метод восстановления данных, когда кодовые слова переменной длины сконструированы симметрично, так что они могут читаться как в прямом, так и в обратном направлении.
SBR Spectral Band Replication, технология улучшения кодеков звука или речи, особенно актуальная на низких битрейтах, основанная на гармонической избыточности в частотной области. SBR может комбинироваться а разными кодеками компрессии звука: сам кодек передает низкие и средние частоты спектра, в то время как SBR реплицирует содержимое с более высокими частотами путем транспонирования гармоник из нижних и средних частот в декодере. Некоторая направляющая информация для восстановления высокочастотной спектральной огибающей передаются как дополнительная информация. При необходимости SBR также восстанавливает или адаптивно подмешивает шумоподобную информацию в выбранном диапазоне частот, чтобы точно воспроизвести сигналы, которые первоначально не содержали или мало содержали тональные компоненты. Идея SBR основана на принципе, что психоакустическая часть мозга человека имеет тенденцию анализировать более высокие частоты с меньшей точностью, чем средние и низкие. Таким образом гармонические явления, связанные с процессом репликации диапазона спектра, должны быть точными только при восприятии и не должны быть технически или математически точными (из Википедии).
SDARS Satellite Digital Audio Radio Services, система спутникового радиовещания.
UEP Unequal Error Protection, неравная защита от ошибок.
VCB11 Virtual CodeBooks 11, средство виртуального кодового блокнота.
VHF Very High Frequency, составная часть обширного диапазона радиоволн, получившего в СССР название ультракороткие волны, УКВ (из Википедии).
[Ссылки]
1. The Successful Implementation of High-Performance Digital Radio site:analog.com. |