[Теория] Контроль звукового сигнала

Теория. учебники, видеоуроки.

Модераторы: Sibson, fat, Till Ulenspiegel, Yuri Prime, Deeman., SD, djnova

[Теория] Контроль звукового сигнала

Непрочитанное сообщение TContinental » 20 ноя 2008, 14:22

(По материалам компании Tektronics)

Часть 1.
Мониторинг цифровой аудиоинфраструктуры

До недавнего времени пониженное внимание вещателей и создателей аудиовизуальных программ к звуковым сигналам по сравнению с видео было обычным явлением. Это объяснялось нехваткой времени и средств. Тем не менее, многочисленные опрошенные представители зрительской аудитории слышат разницу в качестве звучания разных каналов, что подтверждает факт пренебрежения звуком со стороны некоторых телеканалов и продюсеров. В сфере, где репутация и рейтинг значат почти все, низкое качество не позволяет успешно конкурировать с другими каналами.

Теперь, когда появились новые технологии, используемые для увеличения продаж телевизоров стандартного и высокого разрешения, например surround sound, все большее значение приобретает создание и распространение чистого и четкого звукового сопровождения для видео.

С приходом многоканального вещания и создания студий производства программ с многоканальным звуковым сопровождением контроль звукового сигнала стал интегральной частью обеспечения качества вещания. Ключевым компонентом такой стратегии является контрольный монитор.

Есть множество параметров звука, которые необходимо понять, чтобы использовать систему контроля максимально эффективно. Ознакомление с терминами и определениями, а также понимание того, как работает система контроля, позволяет пользователям быстро разобраться в проблемах и как можно скорее их решить. Новейшие системы контроля даже оснащены функцией автоматизированного мониторинга и предполагают минимальное участие человека в процессе отслеживания качества звукового сигнала.

Немного о звуковых сигналах

Большинство технологий производства предполагает использование либо симметричных, либо несимметричных сигналов. Для передачи несимметричных сигналов используется один сигнальный провод и один общий («земля»), для которого применяется экранированный кабель. Коммутация несимметричного сигнала не представляет трудности, и для нее используются относительно недорогие кабели и разъемы, например типа RCA.

Низкая стоимость и простота работы с несимметричными сигналами позволяют использовать их в бытовых устройствах. Но характеристики у этих устройств далеки от совершенства. Отношение сигнал/шум и помехозащищенность гораздо хуже, чем у аппаратов с симметричным звуковым трактом, поэтому бытовая техника гораздо больше подвержена наводкам. Кроме того, бытовые устройства страдают от ограничения длины звукового кабеля.

Симметричный сигнал складывается из двух составляющих, одинаковых по амплитуде и противоположных по полярности при полном соответствии сопротивлений проводников, по которым эти составляющие передаются. Кабели, используемые для передачи симметричных сигналов, обычно имеют три проводника: два из них являются витой парой, а третий служит в качестве экрана и минимизирует наводки.

Симметричные звуковые системы, в которых применяются разъемы XLR, используются в профессиональных комплексах, особенно там, где снижение уровня шума и большая амплитуда сигнала более важны по сравнению с усложнением коммутации и повышением стоимости.

При построении профессиональной аудиоинфраструктуры важно убедиться, что применяемые кабели в рамках всей студии правильно проложены и скоммутированы. В противном случае вероятность возникновения проблем резко возрастает. Помочь убедиться в этом может хорошая система контроля аудио.

Базовый контроль

Простейший мониторинг аудио выполняется с помощью измерителя уровня, который отображает амплитуду звукового сигнала. Существует два типа таких приборов: измеритель уровня VU (Volume Unit) и измеритель пикового уровня программы PPM (Peak Program Meter).

Измеритель VU отображает средний уровень звукового сигнала и характеризуется симметричным временем нарастания и спада, а также относительно большим временем интеграции (обычно 300 мс). Прибор PPM отображает пиковое значение уровня звукового сигнала и отличается малым временем нарастания (10 мс), большим временем спада (2,85 с) и временем интеграции 10 мс.

Вследствие таких существенных различий очень редко бывает, что оба прибора одинаково отображают параметры одного и того же звукового материала.

При измерении звукового сигнала прибор типа PPM в силу своих особенностей должен распознавать более низкие по уровню значения по сравнению с VU, чтобы сделать результаты измерений сравнимыми. Вещатели выяснили, что 8 дБ — это среднее значение разницы между результатами измерения пикового и среднего уровня звукового сигнала. Тестовый тоновый сигнал, уровень которого при измерении прибором VU составляет 0 дБ, на устройстве PPM распознается по уровню как -8 дБ. Учитывая это соотношение можно утверждать, что прибор PPM обеспечивает более надежный контроль пиковых уровней звукового сопровождения программы. Звуковой программный материал должен настраиваться так, чтобы пиковое значение амплитуды равнялось 0 дБ при измерении прибором PPM.

Испытательная диаграмма Лиссажу

Отображение диаграммы Лиссажу обеспечивает мгновенное получение информации об общем распределении энергии при микшировании звука. Хороший прибор способен выявить ошибки, такие как перегрузка, которая появляются на дисплее Лиссажу в виде «квадратных» границ диаграммы. Ориентация диаграммы позволяет быстро выяснить, является ли смесь сигналов симметричной или смещена в ту или иную сторону.

Фазовые ошибки системы

Фазовые ошибки могут стать причиной огромного количества нежелательных эффектов, искажающих звуковой сигнал. Быстрая проверка при помощи гониометра помогает выявить и численно оценить любое достаточно существенное число фазовых ошибок системы.

Для этого на приборе надо установить режим автоматической регулировки усиления, чтобы границы эллипса касались тангенциальных фазовых линий. Если наблюдается прямая линия, совпадающая с осью L = R, значит, левый и правый каналы тестируемого оборудования точно совпадают по фазе и усилению. Если отображается наклонная линия, значит, левый и правый каналы совпадают по фазе, но имеют разную амплитуду. Прямая линия, перпендикулярная оси L = R, свидетельствует о том, что амплитуды каналов равны, но фазы не совпадают.

Несовпадение полярности

Если при записи звука в студии со сложной инфраструктурой используется большое количество микрофонов, то вероятность несовпадения полярности, приводящая к слышимым искажениям звука, резко возрастает. Несовпадение полярности можно легко выявить при помощи гониометра и быстро определить источник противофазного сигнала. Правильно сфазированный сигнал даст прямую вертикальную линию на дисплее Лиссажу. Если фаза сигнала реверсирована, линия на дисплее будет горизонтальной.

Цифровое аудио

Переход на цифровой звук осуществлялся на протяжении многих лет, и доминирующим стандартом звука в видеоиндустрии является AES 3. Стандарт поддерживает частоты дискретизации 32, 44,1 (CD) и 48 кГц (DAT). Последний вариант чаще всего используется в видеопроизводстве. Аналоговый сигнал оцифровывается с выбранной частотой дискретизации, а для представления амплитуды выбирается глубина квантования 16, 20 или 24 бита. Большее число битов для оцифровки звука по сравнению с видео необходимо потому, что более широкий динамический диапазон приводит к увеличению числа битов для получения адекватного отношения сигнал/шум.

Данные, введенные в последовательный цифровой поток, содержат два звуковых канала — канал 1 и канал 2, которые мультиплексированы в один сигнал. Это могут быть самостоятельные монофонические каналы, стереопара, содержащая левый и правый каналы, два идентичных канала, либо эти каналы могут вообще не содержать никаких данных.

Шкала в децибелах (дБ)

Результаты измерений звука часто выражаются в децибелах (дБ). Это объясняется широким динамическим диапазоном f уровней звукового сигнала. Децибел является логарифмической функцией, отражающей измерения либо напряжения, либо мощности. Использование шкалы в децибелах позволяет нам количественно оценивать изменения звукового сигнала, потому что человеческое ухо улавливает изменения амплитуды именно в соответствии с логарифмическим законом.

NдБ = 20 x lg V2/V1 = 10 x lg P2/P1.

Примечание: P = V2/R,
где V1 - эталонный уровень напряжения, V2 - измеренный уровень напряжения, P1 - эталонный уровень мощности, P2 - измеренный уровень мощности, P - мощность, V - напряжение, R - сопротивление.

Обычно при проведении измерений звука используется значение дБм. Это означает, что эталонная мощность равна 1 мВт и применяется терминатор сопротивлением 600 Ом. Поэтому значение 0 дБм эквивалентно напряжению 0,775 В на нагрузке 600 Ом. Можно встретить несколько различных видов измерения по шкале децибел, которые применяются для оценки звукового сигнала. Вот список наиболее часто используемых вариантов:

NдБm = 10 lg P1/0,001 Вт
NдБV = 20 lg V2/1 В rms
NдБv = 20 lg V2/775 мВ rms
NдБu = 20 lg V2/775 мВ rms
NдБSPL=20 lg P1/P2,
где rms - среднеквадратичное значение.


Добавочные биты данных

При использовании разрядности 20 бит четыре наименее значащих бита LSB (least significant bits) могут резервироваться для добавочных данных. Примером использования этих добавочных данных являются каналы обратной связи в студии. Или же эти биты могут использоваться для передачи четырех LSB при 24-разрядной оцифровке.

Биты данных звуковых отсчетов

Данные звукового отсчета располагаются в битах 4…27, причем наиболее значащий бит MSB (most significant bit) — это 27-й бит. Максимальная поддерживаемая глубина квантования — 24 бита. Если ни один из 24 битов не используется для передачи данных звукового отсчета, биты LSB устанавливаются в значение «0». Обычно в рамках телевизионных комплексов используется глубина квантования 20 бит. Это позволяет использовать каналы добавочных данных (биты LSB 4…7).

20-разрядный звук используется в большинстве приложений на телевидении. Однако AES/EBU поддерживает и 24-разрядный звуковой отсчет путем использования битов отсчетов 4…27 при отсутствии битов добавочных данных. Каждый аудиоканал состоит из подциклов, которые несут дополнительные биты данных, также содержащие полезную информацию.

Что такое бит достоверности (V)?

Когда бит достоверности (V) принимает значение «0», аудиоданные подцикла могут быть декодированы в аналоговый звуковой сигнал, а когда этот бит имеет значение «1», декодирование звуковых данных невозможно. Измерительное оборудование можно настроить так, чтобы бит V игнорировался, и продолжать использование данных в измерительных целях.

Пользовательский бит (U)

Пользовательские биты данных могут использоваться для передачи дополнительной информации о звуковом сигнале. Все биты U из 192 подциклов могут быть собраны вместе, что обеспечивает 192 бит на блок. Оператор имеет возможность использовать их для таких целей, как добавление информации об авторских правах и т.д.

Бит статуса канала ©

Бит статуса канала обеспечивает информацию о различных параметрах, ассоциированных со звуковым сигналом. Эти параметры помещаются во все биты C из 192 подциклов для каждого звукового канала.

Использование статуса канала

Есть три уровня применения для данных статуса канала: минимальный, стандартный и расширенный. Стандартный уровень рекомендуется для использования в профессиональных телевизионных приложениях, и в этом случае данные статуса канала содержат информацию о предыскажении сигнала, частоте дискретизации, режиме (моно, стерео и т.д.), использовании добавочных битов (для расширения звуковых данных до 24 бит или в других целях) и циклическом коде избыточности CRC, необходимом для мониторинга всего блока статуса канала.

Бит четности (parity)

Бит проверки четности (паритета) устанавливается так, что значения битов 4…31 формируют четный паритет (четное количество битов), который можно использовать для проверки ошибок в рамках подцикла.




Часть 2.
Подключаясь к будущему

Известно, что правильная прокладка кабелей и соответствующий выбор типа коммутации цифрового звука в рамках всего комплекса гарантирует высокое качество сигналов и на приемной стороне, то есть у потребителя. Во многих случаях проблем со звуковым потоком выясняется, что причина состоит в плохом качестве разъемов.

Существует два основных типа разъемов, предназначенных для работы с последовательными цифровыми данными AES/EBU:
стандартный разъем XLR может использоваться для распределения цифрового сигнала по кабелю типа «витая пара», и дистанция передачи сигнала достигает 100 м без использования дополнительного корректора;
второй тип соединения, наиболее часто используемый в телевидении, — это коаксиальный кабель 75 Ом с разъемом BNC, что определено стандартом AES3-ID. Он представляет собой несимметричный интерфейс, позволяющий вещательным комплексам передавать цифровой звуковой сигнал AES/EBU по стандартному коаксиальному кабелю с использованием уже существующей кабельной инфраструктуры комплекса.

При помощи разъемов BNC и коаксиального кабеля сигналы можно передавать на расстояние более километра. Существует ряд схем, позволяющих осуществлять коммутацию между интерфейсами XLR и BNC либо посредством обычных резисторных цепочек, либо с применением трансформаторов и аттенюаторов.

Кроме проверки этих схем, система контроля важна и для поддержания свободной от ошибок работы со звуком. Это оборудование предоставляет пользователю ряд преимуществ, и его правильное использование помогает добиться максимальной эффективности в работе.

Установка уровней

Необходимо понимать несколько важных моментов при установке уровней и интерпретации цифровых аудиосигналов, отображаемых на устройствах мониторинга звука. Максимальное значение цифрового звука представляется в звуковом отсчете, в котором все биты равны 1, и это соответствует уровню 0 дБFS (FS означает Full Scale — полная шкала). Клипирование и другие искажения звукового сигнала происходят в том случае, если аналоговый звуковой сигнал превышает это значение.

Кроме того, при преобразовании цифровых аудиосигналов обратно в аналоговые может иметь место повышение амплитуды. Это происходит из-за наличия низкочастотного фильтра, который вводится на стадии аналогового выхода при процессе преобразования и приводит к получению более высокой амплитуды уровня сигнала по сравнению с тем, который представляет цифровой сигнал. Поэтому большинство приборов контроля обеспечивают интерполяцию при отображении аудиосигнала, чтобы показывать и эти пиковые значения, и клиппирование сигнала в случае его появления.

Помимо отображения среднего и пикового уровней, которое обеспечивают аналоговые индикаторы, цифровые измерительные устройства позволяют измерять реальные пиковые значения (True Peak Meter). Этот тип измерений обеспечивает постоянное отображение реальных пиковых значений сигнала вне зависимости от их длительности. При проведении измерений пользователь имеет возможность выбрать эталонный и пиковый уровни, соответствующие конкретным требованиям. В качестве примера практического применения можно привести вариант с тестовым уровнем -18 дБFS и пиковым уровнем звукового сопровождения программы — 8 дБFS.

Внедренный звук SD/HD

Звуковые данные AES/EBU могут быть внедрены в область служебных данных видеосигнала SDI. Это, в частности, используется в рамках больших комплексов, где отдельная маршрутизация цифрового звука является очень дорогой.

В менее крупных системах, например производящих студиях, более экономичным является вариант раздельной коммутации видео и звука, поскольку исчезает необходимость в приобретении многочисленных устройств внедрения/извлечения цифрового звука (embedder/de-embedder) из потока SDI.

Служебные данные

В пространстве служебных данных, доступном для использования в рамках компонентного цифрового видео, можно задействовать все интервалы гасящих кадрового и строчного импульсов за исключением небольшого их числа, необходимого для передачи последовательностей EAV (end-of-active video — конец активного видео) и SAV (start-of-active video — начало активного видео).

Служебные данные делятся на два типа: горизонтальные (строчные) HANC (horizontal ancillary) и вертикальные (кадровые) VANC (vertical ancillary). В среде работы с сигналами стандартного разрешения аудиоданные разбиваются на 20-разрядные звуковые отсчеты и дополнительные 4 бита данных, тогда как при высоком разрешении все 24 бита аудиоданных передаются как один пакет.

Эти аудиоданные содержатся в области HANC как для SD-, так и для HD-форматов. Дополнительные данные также передаются в области HANC для систем стандартного разрешения. Для этой области спецификация предусматривает передачу до 16 каналов внедренного звука, которые объединяются в четыре группы по четыре канала звуковых данных в каждой.

Форматирование служебных данных

Служебные данные форматируются в пакеты до того, как будет выполнено их мультиплексирование в поток видеоданных. Каждый блок данных может содержать до 255 слов пользовательских данных, а в каждое пространство служебных данных можно поместить множество пакетов данных. Этим обеспечивается высокая гибкость канала передачи данных. В начале каждого пакета данных стоит заголовок, использующий значения слов, исключенных из цифровых видеоданных и зарезервированных для целей синхронизации.

При использовании внедренного звука может использоваться параметр DBN (Data Block Number — номер блока данных), который необходим для определения появления вертикального интервала переключения. Это позволяет принимающему оборудованию обрабатывать звуковые данные, убирая щелчки и треск, которые могут возникнуть при коммутации. Непосредственно перед данными располагается DC (Data Count — счетчик данных) — слово, содержащее информацию о количестве данных в пакете. И, наконец, вслед за данными идет слово, содержащее контрольную сумму. Оно предназначено для выявления ошибок в пакете.

Базовый внедренный звук в SD

Внедренный звук, определенный в спецификации SMPTE 272M, содержит до 16 каналов 20-разрядных звуковых данных, оцифрованных с частотой 48 кГц и синхронизированных с телевизионным сигналом. Хотя он специфицирован в части стандарта, касающейся композитных сигналов, тот же метод используется и для компонентного цифрового видео. Этот метод соответствует уровню А в стандарте для внедренного звука. Другие уровни обеспечивают большее число каналов, иные частоты дискретизации и дополнительную информацию о звуковых данных.

Пакет аудиоданных содержит один или более звуковых отсчетов из звуковых каналов, число которых может достигать четырех. Каналы внедренного звука являются независимыми друг от друга, хотя и передаются всегда парами.

Существует несколько ограничений относительно распространения пакетов звуковых данных, однако в стандарте заложена и возможность использования довольно старого оборудования. Пакеты аудиоданных не передаются в горизонтальном интервале служебных данных, следующих за нормальным вертикальным интервалом переключения. Они также не передаются в пространстве служебных данных, зарезервированных для контрольных слов выявления ошибок.

Базовый внедренный звук в HD

Изображение
Структура внедренного звука


В применении цифрового звука AES/EBU в среде HD есть и сходства, и отличия по сравнению с SD. Форматирование пакетов служебных данных такое же, как для SD, но информация, содержащаяся в пользовательских данных, отличается. Это обусловлено тем, что все 24 бита аудиоданных отправляются как группа и не делятся на 20 бит аудиоданных и дополнительный пакет с четырьмя добавочными битами.

Поэтому общее число бит, используемых в HD, составляет 29 (в отличие от 23 бит в SD), где 24 бита аудиоданных располагаются в четырех словах служебных данных вместе с битами флагов C, V, U и Z. Поскольку полные 24 бита аудиоданных передаются внутри пользовательских данных, дополнительные пакеты данных в HD не используются.

Последовательный цифровой звуковой сигнал AES/EBU

С переходом на цифру последовательные цифровые сигналы видео и звука становятся общепринятыми в комплексах производства программ и вещательных станций. Во многих случаях видео и звук объединяются и передаются как единый последовательный поток цифровых данных. Это позволяет пользователю работать с сигналами в рамках цифровой инфраструктуры и коммутировать их посредством матрицы SDI, чем обеспечивается высокое качество.

Если пользователь хочет отделить аудиопотоки от видео, цифровой звук может быть демультиплексирован и коммутироваться самостоятельно посредством аудиокоммутатора.

На приемной стороне после того, как мультиплексированный звук прошел коммутатор, может возникнуть необходимость его извлечения из потока видео для монтажа, обработки или применения других операций. Это требует наличия демультиплексора, извлекающего звук формата AES/EBU из SDI. Выход стандартного демультиплексора оснащен интерфейсом BNC, а также разъемами для двух стереопар цифрового звука AES/EBU.

Качество звука будет продолжать приобретать все большую важность для продюсеров, вещателей и зрителей. Учитывая обострение конкуренции, качество контента может реально стать причиной взлетов и падений. Поэтому цифровые студии должны уделять больше внимания созданию и обработке звуковых сигналов с высоким качеством.

Используя соответствующие устройства мониторинга звука, можно своевременно выявить ошибки и исправить их, обеспечив максимально возможное качество звукового сопровождения телевизионных программ.
TContinental
EXTROVERT
 
Сообщения: 10319
Зарегистрирован: 02 май 2006

Вернуться в Учебные материалы

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 0

Наши проекты: MixGalaxy.ru | Всё о FruityLoops и FL Studio на MixGalaxy.ru | Всё о Propellerhead Reason на ReasonMusic.ru
cron