[Теория] Дитеринг (Dithering)

Теория. учебники, видеоуроки.

Модераторы: Sibson, fat, Till Ulenspiegel, Yuri Prime, Deeman., SD, djnova

[Теория] Дитеринг (Dithering)

Непрочитанное сообщение TContinental » 20 ноя 2008, 14:08

Что такое Дитеринг (дизеринг)?



На данный момент как бы это ни было странно CD-DA или проще аудио CD является одним из популярных форматов распространения музыки (не без помощи пиратов конечно ). И, как всем известно, на CD звук записывается в формате PCM (кто не понял - это WAV) с такими вот параметрами: Частота дискретизации 44,1 кГц, а разрядность 16-бит. Вроде круто WAV, но все, же критически настроенные слушатели или просто опроверженцы данного формата, отмечают некоторые недостатки CD-DA, связанные с недостаточным динамическим диапазоном, эффектами 16-разрядного квантования и "звоном" интерполяционных фильтров. Существует несколько способов, как можно минимизировать артефакты квантования при мастеринге аудио для компакт-дисков или других цифровых носителей. Но мы рассмотрим, как это сделать при помощи «Дизеринга».
Дизеринг (Dithering) - технология для избавления от последствий отрицательного обрезания оцифрованного звука при переводе в формат с меньшей глубиной оцифровки (16 бит, 8 бит) из более высокой (24 бита, 32 бита). Это происходит с помощью так скажем наложения шума (еще называют «белым» шумом) что приводит к уменьшению влияния ошибок квантования.
Смысл очень прост и не составит мне кажется, труда разобраться, например звук 24 бита, дает глубину оцифровки до - 144 db или что-то в этом роде против 16 бит - 96 db (это диапазон амплитуды от максимального значения громкости 0 db)- после перевода в 16 бит часть звуковой информации, находившейся в более низком диапазоне чем - 96 db (тихие звуки) обрубается. Это может давать искажения. Вот в этом случае и нужно применить наложение шума. Это и есть «Дизеринг». Учтите, если же искажений нет применять его не обязательно это будет, лишь пустой тратой времени.
Для наглядного примера предлагаю сгенерировать синусоиду в звуковом редакторе, например в Sound Forge. Как я уже говорил, генерируем синусоиду 44,1/24 с частотой 1 кГц и длительностью 10 сек, амплитуду для определенности выберем -3 db. Посмотрим спектр (в свойствах анализатора: оконная функция - Blackman-Harris, Noise Floor -150db, FFT Size - 32768). Имеется острый шпиль на 1 кГц и больше ничего. Теперь при помощи Bit-Depth Converter перейдем к 16 битам. Dither поставим None, Noise Shaping - Off. Опять посмотрим спектр. Имеется тот же шпиль, но, кроме этого, мы увидим появление неравномерного шума, если перейти к логарифмическому масштабу, то будет хорошо видно появление гармоник около основной частоты. Теперь после Undo поставим Dither - Triangular и опять перейдем к 16 битам. Теперь вместо кучи гармоник мы будем иметь равномерный шум очень малой амплитуды.

А выглядит это примерно вот так:

Изображение
24-битный сигнал и 16-битный сигнал,
полученный из 24-битного с помощью dithering’а


Ну а теперь же пора уже разобраться с основными пунктами Дизеринга, за что они отвечают и когда используются.
Первый пункт это:

Quantization depth - Это значение определяет конечную разрядность звука. Оптимизируют сигнал с большей разрядностью в меньший. Например, если звук будет просчитываться в .wav файл для записи CD, то нужно поставить 16-бит.
Следующим пунктом будет:

Dither type - служит для добавления Dither-шума маскирующий шумы квантования, если вы уменьшаете разрядность Bit-Depth.
Например, при записи 24-битного звукового файла на CD после применения дизеринга получится более чистый сигнал, чем после простого преобразования разрядности.

Dither Type состоит (как у меня показано) из 4 видов обработки.

Rectangular - Прямоугольный. Устраняет искажения, вызванные преобразованием к более низкой разрядности. Уровень шума зависит от сигнала.

Triangular - Треугольный. Уменьшает искажения, вызванные преобразованием к более низкой разрядности и уменьшает уровень шумов преобразования, производя немного более высокий уровень шумов.

Highpass Triangular - Высокопроходный треугольный. Уменьшает искажения, вызванные преобразованием к более низкой разрядности и уменьшает уровень шумов преобразования, производя немного более высокий уровень шумов. Шумы смещаются к более высоким частотам, чем при стандартном "треугольном" (Triangular) дизеринге.

Ну и наконец, 4 я не побоюсь сказать этого слова «бесполезный», но все же.

Gaussian - Выполняет дизеринг не так хорошо, как Rectangular или Triangular, но может подойти для обработки некоторого материала.

Итак, идем дальше следующий пункт:

Noise shaping (что в переводе означает «Формирование Шума») - снижает ощутимые собственные шумы сигнала, сдвигая большинство шумов в более высокочастотную область.

Noise shaping имеет 2 вида обработки – это High-pass contour и Equal loudness contour.

High-pass contour - Сдвигает шумы в более высокочастотную область. Частоты, к которым смещается шум - близки к частоте Найквиста (Частота Найквиста — частота сигналов в цифровой обработке, равная половине частоты дискретизации) Следовательно, Вы не должны применить Noise shaping к файлам с частотой дискретизации менее 44.1 кГц, так как частота этого диапазона чувствительна для человеческого уха и может привести к ухудшению звучания.

Equal loudness contour (что в переводе означает КОНТУРЫ РАВНОЙ ГРОМКОСТИ) - Полученные психофизическими методами контуры, или кривые, описывающие звуки разной частоты и интенсивности, воспринимаемые испытуемыми как одинаково громкие. Все звуки, лежащие на одной кривой, воспринимаются как одинаково громкие, хотя их частоты и интенсивности могут быть разными. Подобные кривые могут быть построены для разных значений громкости, следовательно, громкость является функцией частоты. Эти кривые также называют изофоническими контурами, или — в честь авторов, которые первыми ввели их в научный оборот, — кривыми Флетчера—Шансона Равномерно распределяет шумы на высоких и низких частотах.
Например, если взять звук 20db с частотой 1000Hz он будет воспринят так же как звук частотой в 50db частотой в 100Hz. Все дело в том, что наш слух менее чувствителен к низким частотам, чем к средним и высоким.



Разновидности Dithering'a


Начнем с терминов:
PDF - probability distribution function (Функция распределения вероятности)
LSB - least significant bit (Наименее значащий бит)
TPDF - triangular PDF (фактически разновидность PDF, но раз уж есть такой то есть)

Итак, Разные виды dithering-шума отличаются по амплитуде, по спектру и по PDF. Для белого шума PDF показывает, как часто встречаются в шуме значения различных амплитуд. Стандартные виды PDF - треугольная, прямоугольная, гауссова. Например, в треугольной шумы чаще будут встречаться с амплитудами вблизи нуля. В прямоугольной все значения амплитуд шума равновероятны, но в определенных пределах.

Для обозначения максимальной амплитуды dithering-шума используют единицу LSB.
LSB - расстояние между двумя соседними (ближайшими возможными) значениями амплитуды в квантованном 16-битном сигнале. Если говорят, что шум имеет амплитуду 1 LSB от пика до пика (1 LSB peak-to-peak), то это значит, что он может принимать значения от -0,5 LSB до +0,5 LSB.
Чаще всего для dithering'а используется белый шум с амплитудой от 1 до 2 LSB. Существуют два стандартных вида dithering-шума. Первый - белый шум с прямоугольной PDF и амплитудой 1 LSB от пика до пика. Такой шум практически полностью устраняет гармонические искажения в квантованном сигнале, однако имеет недостаток: громкость шума квантования меняется со временем, и зависит от исходного сигнала. Это явление называется модуляцией шума.
Второй распространенный вид шума dithering'а - тоже белый шум, но с амплитудой 2 LSB от пика до пика и треугольной PDF. Такой шум наиболее часто используется при снижении разрядности и называется standard TPDF dither. Этот вид dithering'а вносит немного больше шума в фонограмму (-98 дБ (А)), однако практически полностью устраняет гармонические искажения и модуляцию шума.
В некоторых системах снижения разрядности можно выбирать амплитуду dithering-шума, изменяя баланс между количеством шума и количеством искажений. Маленькая амплитуда dithering-шума вносит меньше заметного шума, однако может не полностью устранить гармонические искажения и модуляцию шума. Большая амплитуда dithering-шума вносит больше слышимого шума, но практически полностью подавляет искажения и модуляции. Для большинства приложений оптимальным выбором среди алгоритмов dithering'а является standard TPDF dither.




Насколько полезен dithering?


Несмотря на то, что стандартный dithering повышает уровень шума фонограммы до -98 дБ (А), это не значит, что мы не сможем услышать в фонограмме звуки тише -98 дБ. В 16-битной фонограмме, если использовался стандартный dithering, можно отчетливо различить звуки с такими маленькими амплитудами, как -100…-110 дБ - особенно наглядно это демонстрируется на синусоидах со средними частотами. Дело в том, что наше ухо может "слышать сквозь шум", действуя как спектроанализатор. Как на спектрограммах видны пики синусоид, возвышающиеся над шумом квантования ,так и наше ухо способно улавливать эти пики сквозь шум, несмотря на то, что суммарная амплитуда шума больше амплитуды полезного сигнала.
При этом в 16-битном сигнале практически отсутствуют гармонические искажения, связанные с квантованием . Синусоида звучит абсолютно неискаженной, без обертонов. Единственный эффект квантования с ditheringом - постоянный шум, который, впрочем, обычно находится ниже порога слышимости.
Dithering применяется во многих системах для мастеринга и в звуковых редакторах при работе со звуком пониженной разрядности. Почти любые преобразования 16-битного звука (например, эквалайзер, реверберация, динамическая обработка, изменение частоты дискретизации) дают в результате звук большей разрядности. Но так как исходный звук был 16-битный, то звуковые редакторы приводят к 16-битному формату и результирующий звук.
Правильный способ такого приведения - это dithering, а "неправильный" - округление. Dithering применяется при каждой операции над 16-битным звуком, добавляя определенное количество шума. Если операций много, то уровень шума может стать заметным, хотя это все же лучше искажений округления. Поэтому при редактировании звука обычно применяются форматы с повышенной разрядностью (например, 24 или 32 бита) - в них нет необходимости применять dithering, поскольку при такой разрядности артефакты квантования, слишком малы, чтобы обращать на них внимание. Отметим, что операцию снижения разрядности до 16 бит в этом случае выполняют в последнюю очередь, стремясь всю обработку (в том числе, изменение частоты дискретизации и лимитирование) провести в формате с повышенной разрядностью.
При мастеринге некоторые звукоинженеры предпочитают стандартный dithering другим, более сложным методам снижения разрядности из-за "проверенности" метода и "нейтральности" звучания белого шума.
TContinental
EXTROVERT
 
Сообщения: 10319
Зарегистрирован: 02 май 2006

Непрочитанное сообщение Metalmar » 02 дек 2008, 09:56

МЕГА ПОЛЕЗНЫЙ МАТЕРИАЛ!!!!!! :o
Metalmar
Junior Member
 
Сообщения: 50
Зарегистрирован: 30 апр 2005


Вернуться в Учебные материалы

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 0

Наши проекты: MixGalaxy.ru | Всё о FruityLoops и FL Studio на MixGalaxy.ru | Всё о Propellerhead Reason на ReasonMusic.ru