Цифровой звук. Начало.

Что такое аудио сигнал, как он представляется в цифровом виде
     При помощи микрофона звуковые волны преобразуются в электрический сигнал (напряжение), пропорциональный звуковому давлению.
     В цифровом мире аналоговый сигнал представляется в виде значений амплитуды сигнала во время дискретизации. Период дискретизации — это обратная величина к частоте дискретизации и означает время между двумя отсчетами цифрового сигнала.
      Для преобразования аналогового сигнала в цифровой применяется Аналого-Цифровой Преобразователь. АЦП оцифровывает сигнал с заданной частотой дискретизации и выдает поток данных заданной разрядности. Разрядность определяет количество уровней квантования цифрового сигнала. На графике зеленым показан непрерывный сигнал, красным дискретизированный, а голубым ошибка/шум квантования (арифметическая разница между исходным и дискретизированным сигналом).

Частотный диапазон (frequency range)
     Выбор частоты дискретизации определяет частотный диапазон сигнала (полоса частот между минимальной и максимальной). Считается, что человеческое ухо воспринимает частоты от 20Гц до 20кГц. Для записи/воспроизведения качественного аудио сигнала требуется частота дискретизации свыше 40кГц. Первые цифровые записи (в конце 70-х) сохранялись на видеокассетах, как видеосигнал, и из-за технических соображений частота дискретизации была выбрана 44,1кГц. Эта частота дискретизации применяется на всех музыкальных компактных дисках (стандарт CD-DA).
     При записи звуковой/музыкальной дорожки к фильму (формат DVD) принята другая частота дискретизации — 48кГц. Выбранная частота кратна количеству кадров в секунду (24 кадра в секунду) в обычной кинопленке. Разница в качестве музыки при записи с этими двумя частотами дискретизации практически неуловима.
     Качество звука слегка теряется при конвертации записи с одной частотой дискретизации в другую. Это особенно заметно при воспроизведении CD дисков на DVD проигрывателях низкого класса. DVD проигрыватели воспроизводят сигнал с частотой 48кГц и для проигрывания музыкальных дисков производят передискретизацию сигнала (44,1кГц в 48кГц).

Децибелы
Децибел — безразмерная единица, применяемая для измерения отношения некоторых величин. Например, усиление усилителя можно показать, как соотношение между исходным (опорным) V0 и усиленным V1 напряжениями. Если усиленный сигнал больше исходного в 100 раз, то усиление равно 40дБ.

Громкость (loudness)
     Громкость звука — субъективное восприятие силы звука, зависищая от многих параметров аудио сигнала и обстановки прослушивания. Для объективного обозначения громкости используют уровень звукового давления.
     Звуковое давление — переменное избыточное давление, возникающее в упругой среде при прохождении через неё звуковой волны. Единица измерения — паскаль (Па).
     Уровень звукового давления (Sound Pressure Level) — измеренное по логарифмической относительной шкале значение звукового давления, отнесённое к опорному давлению (которое считается нулевым уровнем). Единица измерения — dB(SPL) или просто дБ/dB. В качестве опорного значения используется порог слышимости человеческого уха — 20мкПа.

Уровень записи (program level)
     В аналоговом мире для измерения уровня записи применяется калиброванный вольтметр. Вольтметр из-за механической инерции сглаживает сигнал и показывает усредненнное значение напряжения. Этот прибор показывает значение сигнала в относительных единицах VU (Voltage Units). На практике используются разные логарифмические шкалы (в децибелах) относительно средне-квадратичного значения (RMS) опорного напряжения. dBV — относительная логарифмическая  шкала, где в качестве опорного напряжения выбран 1В. dBv или dBu — относительная логарифмическая  шкала, где в качестве опорного напряжения выбрано 0.775В.
     В качестве 0 VU в профессиональной аппаратуре принято использовать +4dBu (1.227В), а в бытовой технике -10dBV (0.316В).
     В цифровом мире применяется шкала dBFS (Full Scale) — относительная логарифмическая  шкала, где в качестве опорного значения выбрано максимально допустимое значение. Получается, что 0 dBFS — максимально допустимый сигнал, а например сигнал с уровнем в два разе меньше будет -6dBFS.

Запас по уровню сигнала (headroom)
      Запас по уровню — это уровень выше максимально допустимого уровня (Permitted Maximum Level — PML) сигнала. При записи возможны короткие всплески, которые не влияют на средний уровень и поэтому нужен запас для предотвращения обрезания сигнала (clipping). Например, для 16-битной записи EBU (European Broadcasting Union) рекомендует использовать запас 9дБ, то есть макисально допустимый уровень записи будет -9dBFS, а для 24-битной записи -24dBFS.

Динамический диапазон (dynamic range)
     Динамический диапазон — это отношение между самым громким и самым тихим (выше уровня шума) звуками в сигнале/записи. Для примера записи на пластинках имеют динамический диапазон в пределах 60-80дБ, записи на компакт дисках свыше 90дБ. После дискретизации, количество разрядов АЦП задает максимально возможный динамический диапазон. При уменьшении разрядности записи (например с 24 бит до 16) динамический диапазон сужается. Для уменьшения ошибок квантования во время конвертации цифрового сигнала применяется dithering и noise shaping.

No comments:

Post a Comment