Описание и свойства преобразователей

Существует несколько способов описать дискретный преобразователь (или систему) – разностные уравнения, импульсная характеристика, частотная характеристика, переходная функция, передаточная функция. Все описания однозначно взаимосвязаны между собой.

Разностные уравнения с постоянными коэффициентами

Разностное уравнение — формула, по которой рассчитывается выходной отсчет y(n) на основании:
• текущего отсчета x(n)
• предыдущих отсчетов x(n−1), x(n−2),…,x(n−M)
• предыдущих выходных отсчетов y(n−1), y(n−2),…, y(n−N)

y(n) = ∑bix(n−i)−∑aj(n−j), i=0..M, j=1..N

Такая форма записи позволяет напрямую реализовывать преобразователи на цифровых устройствах.

Пример дискретного преобразователя, описанного разностным уравнением – экспоненциальный сглаживающий фильтр.

y(n)=0.01∙x(n)−0.99∙y(n−1)

Для вычисления этого преобразователя необходимо сохранять значение выходного сигнала с предыдущего шага вычисления.

Отсчеты входного сигнала x(n) попадают в преобразователь с частотой дискретизации. Вычисления могут производиться с различной скоростью (зависит от мощности цифрового устройства), главное требование, чтобы скорость вычислений позволяла получать выходные отсчеты быстрее, чем период дискретизации.

Импульсная характеристика (impulse response)

Импульсной характеристикой преобразователя называется реакция системы (т.е. ее выходной сигнал) на единичный импульс при нулевых начальных условиях.

Переходная функция (step response)

Переходная функция — реакция системы на входное воздействие в виде функции единичного скачка (функция, равная нулю для отрицательных значений аргумента и единице — для положительных), при нулевых начальных условиях.

При взятии производной от переходной функции получаем импульсную характеристику. Если поставлена задача получить импульсную характеристику системы, то удобнее снять переходную функцию, подав единичный скачок на преобразователь, и по переходной функции рассчитать импульсную характеристику системы, взяв производную.

Частотная характеристика (frequency response)

Частотная характеристика преобразователя определяется как преобразование Фурье (дискретное преобразование Фурье в случае цифрового сигнала) от импульсной характеристики.

Дискретная передаточная функция (transfer function)

Дискретная передаточная функция представляет собой отношение Z-преобразования выходного сигнала к Z-преобразованию входного сигнала.

Рекомендованная литература:

Сигналы и преобразователи

Непрерывный сигнал (аналоговый сигнал). В любой момент времени значение сигнала может принимать произвольное значение.

Квантованный (непрерывно-дискретный) сигнал. В любой момент времени значение сигнала представляется элементом из дискретного множества.

Дискретно-непрерывный сигнал. В дискретные моменты времени значение сигнала может принимать произвольное значение.

Дискретный сигнал. В дискретные моменты времени значение сигнала представляется элементом из дискретного множества.

Цифровой сигнал – форма представления дискретного сигнала, дискретные значения которого кодируются двоичным кодом.

M = 2m, M — число уровней квантования, m — число разрядов

Преобразователь устройство или программа изменяющее входной сигнал в выходной.

Преобразователь (system) – математическая модель системы, основанная на операторе преобразования.

Оператор преобразования — это функция, определяющая взаимосвязь между двумя векторами (входным и выходным сигналами).

y(t) = H{x(t)}

Классификация преобразователей

Непрерывный преобразователь (аналоговое устройство). Непрерывный входной и выходной сигналы. Такой преобразователь не содержит импульсных элементов и квантователей уровней.

Дискретный преобразователь (цифровое устройство). Дискретный входной и выходные сигналы.

Комбинированный преобразователь. Цифровое устройство, на вход которого подается аналоговый сигнал и/или если аналоговый сигнал выходит из цифрового устройства будет комбинированным преобразователем.

Линейный преобразователь (linear system). Преобразователь линейный, если сложный входной сигнал может быть описан как сумма простых сигналов и результат преобразования не изменяется.

α∙y1(t)+β∙y2(t)=H{ α∙x1(t)+ β∙x2(t)}

x1(t), x2(t) — входные сигналы

y1(t) = H{x1(t)}, y2(t) = H{x2(t)} — выходные сигналы

α, β — любые скалярные величины

Неизменяемый во времени преобразователь (time invariant). Преобразователь является инвариантным ко времени, когда результат преобразования не зависит от времени этого преобразования. Если входной сигнал x(t) поступает на преобразователь сейчас или через определенное время T, то результат преобразования будет идентичный первому, за исключением сдвига по времени — y(t) = y(t−T)

Практическое значение имеют преобразователи с ненарушенной причинно-следственной связью (causal), а именно выходной сигнал зависит только от предыдущий значений входного и выходного сигналов, и не зависит от будущих значений.

Линейный инвариантный ко времени преобразователь (causal LTI system). Линейные инвариантные ко времени преобразователи — основные преобразователи, применяемые при обработке сигналов. Такой преобразователь полностью описывается импульсной характеристикой, разностным уравнением, частотной характеристикой или передаточной функцией.

Компрессия аудио-сигнала

Пойдет речь не о сжатии информации, с целью экономии места на диске или в интернете, а о компрессии динамического диапазона при обработке звука. Звуковой эффект —компрессор, применяют при звукозаписи, озвучивании концертов или вещании. Компрессор (compressor) делает более тихие звуки громкими, уменьшая разницу между громкими и тихими звуками, и тем самым компрессирует динамический диапазон. Правильно настроенный компрессор позволяет устранять всплески громкости (например, удары барабана), неравномерность записи (если вокалист двигает микрофон или басист неравномерно извлекает звук), добавляет продолжительность в звук соло-гитары (sustain) и в целом может сделать звук более громким.

     Для понимания работы компрессора рассмотрим пример его динамической характеристики. По горизонтальной оси отложены уровни входного сигнала, а по вертикальной — выходного. Если входной сигнал находится в пределах от −100дБ до −60дБ, то выходной сигнал глушится до −100дБ. Такая обработка позволяет не пропускать сигнал ниже определенного уровня и применяется для подавления шума (noise gate).
     Следующий отрезок (−60дБ и −20дБ) наклонен под 45 градусов и означает линейную обработку, а именно входной сигнал будет усиливаться на 15дБ.
     Если входной сигнал попадает в рамки от −20дБ до 0дБ, то он будем сжиматься в диапазон от −5дБ до 0дБ. Разница между диапазонами 20 к 5 определяет соотношение компрессии 4:1. Динамическую характеристику принято описывать следующими параметрами:
Noise gate (уровень шума) — определяет уровень, ниже которого сигнал не проходит (обрезается).
Threshold (пороговый уровень) — задает граничный уровень между линейным участком и началом компрессии.
Ratio (соотношение между входным диапазоном и выходным) — задает степень компрессии. Если входной динамический диапазон меньше выходного, то происходит расширение динамического диапазона и компрессор становится экспандером (expander)
Makeup gain — уровень громкости. После компрессии уровень сигнала становится меньше исходного и выходным уровнем громкости можно «восстановить справедливость». В случае расширения диапазона уровень сигнала повысится, и громкость нужно будет понизить.
     В рассмотренном выше примере использовались такие значения параметров: Gate −60, Threshold −20, Ratio 4:1, Makeup 15.

     Цифровые компрессоры позволяют практически произвольно редактировать динамическую характеристику, что дает большую свободу при использовании.
Рассмотрим схему работы компрессора. Входной динамический диапазон сигнала рассчитывается по средней мощности входного сигнала (Vrms) или по пиковым значениям (Vpeak). В некоторых компрессорах есть выбор между этими двумя опциями. Детектор уровня (на схеме Level detection) формирует управляющий сигнал, который управляет ослаблением (Gain Reduction Device) основного аудио-потока. Вместо входного сигнала (на схеме Audio Input) можно использовать сигнал с другого трека или устройства (External Input), например функция удаления  свистящих согласных (De-Esser), реализуется с помощью этой возможности — на дополнительный вход подается фильтрованный сигнал (фильтр выделяет свистящий сигнал), который управляет ослаблением. Подобная схема применяется и при наложении голоса DJ-ея на музыку (Ducking). Голосовой сигнал подается на внешний канал, который управляет ослаблением.

     Кроме динамической характеристики компрессоры позволяют управлять временем срабатывания механизма ослабления звука.

Attack (время атаки) — время, которое проходит между превышением порогового значения и началом ослабления сигнала.
Release (время спада) — время, которое проходит между тем, как уровень входного сигнала стал ниже порога, и моментом, когда компрессор перестает ослаблять сигнал.
Некоторые компрессоры позволяют рассчитывать ослабление с упреждением (look-ahead). При этом основной сигнал задерживается на время упреждения. Такая техника позволяет недопустить превышение порогового значения и сделать компрессию более мягкой.

     Компрессор может применяться при многоканальной обработке (стерео или больше каналов). В этом случае применяются различные схемы управления ослаблением. Управляющий сигнал может формироваться в каждом канале отдельно (что может привести к некоторому рассогласованию каналов) или предварительно усредняться по всем каналам и только после этого поступать на схему детектирования уровня.

     В случае использования компрессора при мастеринге можно совмещать компрессию динамического диапазона с квантованием/дизерингом. При квантовании (например, когда из 24-битной записи получают 16-битную) происходит сужение динамического диапазона и некоторые плагины позволяют совмещать две эти операции, что приводит к уменьшению общего уровня шума.

     При мастеринге также применяют многополосные (multi-band) компрессоры. Весь частотный диапазон разбивается на поддиапазоны (обычно 3 или 4) и параметры компрессии  в каждом диапазоне устанавливаются свои. Это позволяет, например, отделить мощные удары барабана, которые при общей компрессии могут привести к ослаблению вокала и других инструментов. Для разделения частот используют IIR или FIR фильтры. Фильтры IIR практически не вносят задержку в сигнал, но при этом возможны фазовые искажения. Фильтры FIR (с линейной фазовой характеристикой) задерживают сигнал на фиксированное время и рекомендуются для мастеринговых работ, где задержка сигнала не имеет принципиального значения.

Рекомендованная литература:
Цифровой звук. Начало.