Цифровой аудиосигнал

Аудиосигнал — аналоговое или цифровое представление звука. Используется при записи, редактировании (обработке звука) и воспроизведении. Аудиосигнал не предназначен для передачи сообщений или событий. Также мы не будем рассматривать сжатый аудиосигнал, так как он не пригоден к цифровой обработке.

Среднее значение аналогового сигнала должно быть близко к 0В. Иначе постоянная составляющая будет вызывать затраты мощности без полезного действия. Часто усилители или активные колонки имеют защиту, которые выключают оборудование при появлении постоянной составляющей.

Дискретизация (sampling) — преобразование непрерывного аналогового сигнала в дискретный сигнал, производится Аналого-Цифровым Преобразователем (АЦП).

Перед дискретизацией сигнал транслируется в диапазон АЦП (например: от 0 до 5В). При трансляции нельзя допустить выход сигнала за диапазон АЦП, иначе возникнут неустранимые искажения — обрезание (clipping) сигнала.

Например, аналоговый сигнал, поступающий на АЦП, имеет диапазон от −1.5В до +1.5В. После трансляции получаем сигнал в диапазоне от 0.25 до 4.75В, который не выходит за рамки диапазона АЦП.

После дискретизации получаем цифровой сигнал, дискретные значения которого кодируются двоичным (прямым) кодом в диапазоне от 0 до M−1.

M = 2m, M — число уровней квантования, m — число разрядов.

Отсчет (sample) — одно значение дискретного сигнала. Цифровой сигнал является последовательностью отсчетов заданной разрядности, полученных с заданной частотой дискретизации.

Для цифровой обработки сигнал, полученный с АЦП, необходимо преобразовать в вещественное представление, чтобы оперировать теми же значениями, что и в аналоговом сигнале (в нашем примере: от −1.5 до 1.5).

Вещественные числа (real numbers) представляют в цифровом устройстве с помощью форматов с фиксированной или плавающей запятой.

Фиксированная запятая (fixed-point) — формат представления вещественного числа в памяти цифрового устройства в виде целого числа (integer). Основное преимущество такого представления то, что с такими числами можно производить арифметические операции, как с обычными целыми числами, но при этом нужно следить за порядком результата и не допускать переполнения.

Плавающая запятая (float-point) — форма представления действительных чисел, в которой число хранится в форме мантиссы и показателя степени (порядка). Для реализации формата чисел с плавающей запятой требуется аппаратная поддержка процессора.

Параметры цифрового аудиосигнала

Разрядность цифрового сигнала (bits resolution) — количество уровней квантования дискретного сигнала. В профессиональной аудио обработке применяется разрядность 16, 20 и 24 бит.

Частота дискретизации (sampling rate) — частота, с которой аналоговый сигнал дискретизируется в дискретный сигнал. В профессиональной аудио обработке применяются частоты дискретизации 44100Гц или 48000Гц. Также используются частоты в 2 или 4 раза выше — 88200/96000 или 176400/192000.

Формат представления — целые (прямой код) или вещественные (фиксированная или плавающая точка) числа.

Количество каналов — сигнал может быть моно, стерео и многоканальный (3..8 каналов). В некоторых случаях аудио обработка должна учитывать количество каналов.

Также цифровой сигнал характеризуется общими с аналоговым сигналом параметрами — мощность сигнала, частотный диапазон (frequency range), динамический диапазон (dynamic range).

Сглаживающий фильтр

Применяется для усреднения или сглаживания входного сигнала. При обработке звука используется для устранения скачков при изменении управляющих сигналов. Например, при повороте цифровой ручки громкости, значение усиления изменяется скачкообразно, что приводит к щелчкам/треску в записи. Для устранения такого дефекта достаточно сгладить управляющий сигнал.

Разностное уравнения, описывающее сглаживающий преобразователь:

y(n)=(1−α)∙x(n)+α∙y(n−1), 0<α<1

Для вычисления этого преобразователя необходимо сохранять значение выходного сигнала с предыдущего шага вычисления.

Есть два подхода к выбору коэффициента α. Первый — рассматривать преобразователь, как низкочастотный фильтр. Коэффициент α выбирается исходя из частоты дискретизации Fs (скорость поступления входных отсчетов) и от желаемой частоты среза Fc, где мощность сигнала (квадрат значений сигнала) ослабится в два раза.

Ослабление мощности сигнала в два раза по логарифмической шкале составит 10∙log(0.5)=−3Дб, а значения самого сигнала уменьшатся на 20∙log(0.5)=−6Дб по логарифмической шкале.

Например, задаем частоту дискретизации 44100Гц и частоту среза 50Гц. По формуле вычисляем коэффициенты
Разностное уравнения, описывающее сглаживающий фильтр с заданными параметрами:

y(n)=0.9929∙x(n)+0.0071∙y(n−1)

Получим импульсную характеристику, подав единичный отсчет на преобразователь. Задаем количество отсчетов — 1024, обнуляем все входные отсчеты кроме первого и получаем отклик системы, состоящий из 1024 отсчетов.

Далее вычисляем частотную характеристику с помощью дискретного преобразования Фурье.

Отображаем частоты в диапазоне от 0 до 4∙Fc. На нулевой частоте амплитуда единица, что означает отсутствие ослабления на низких частотах. На частоте 50Гц ослабление −3Дб

Второй подход рассматривать преобразователь во временной области. Постоянная времени (time constant) – это время, за которое переходная функция достигнет 63% от конечного значения. Постоянная времени связана
с частотой среза:

Рассчитаем постоянную времени для нашего примера. По формуле получается — 0.00318 сек. Получим переходную характеристику, подав все единицы на преобразователь. Задаем количество отсчетов — 1024, все входные отсчеты устанавливаем в единицу и получаем отклик системы, состоящий из 1024 отсчетов.
Рекомендованная литература