Обработка на сигнали/Dithering

От Уикикниги

Кой може да съхрани звука в цифров вид без фатални загуби от началото на записа до финалното мастериране?[редактиране]

Дитърът често е пропускан в обясненията за дигитално аудио по незнайни причини... Но ако искате звукът ви да е максимално качествен трябва да сте напълно наясно с функциите му. Чудите ли се понякога защо записаните от вас CD не звучат толкова пространствено колкото 24-битовия микс? Или защо повечето цифрови ревербератори влошават усещането за обем, въпреки че от тях очакваме именно да добавят пространственост?

Да проследим един кратичък звук![редактиране]

Съвсем набързо ще направим преглед какво се случва при цифровата обработка на сигнали. За жалост повечето производители на аудио софтуер и хардуерни процесори не обръщат нужното внимание на изключително важния проблем за разрядността (wordlength) в сложните изчислителни процедури. Ще проверим какво се случва в цифровия аудио сигнал при някаква обработка, променяща нивото му (смесване, честотни корекции, компресиране, добавяне на ефекти и т.н.) в използвания от вас софтуер или хардуер. На пръв поглед е просто – обикновена аритметика... Да, но точността при извършване на тези обикновени аритметични действия ще определи дали звукът ви е чист и ясен или стърже като тенекиено ренде!

При всички случаи сигналът се обработва последователно по дискретните стойности, които са продукт на квантоването (цифроване или дискретизация). При обикновена промяна на нивото процесорът взема първата дискретна стойност (sample), извършва умножение и извежда като резултат ново число, след което преминава към следващата стойност. При стерео аудио CD това са 88200 стойности в секунда.

Да вземем една примерна стойност 1.51, която искаме да намалим с 6 dB. Процесорът просто ще раздели стойността на 2, тъй като поради логаритмичния характер на децибелите именно това означава 6 dB. В резултат ще получим новата стойност 0.755 – числото вече се представя с четири знака, а оригиналът беше само с три! Значи необходимата ни разрядност се увеличи при едно просто действие! И така става при всяка операция, която извършвате с цифров звук! Дали софтуерът ви ще се справи с лавинообразно растящата нужда от повече битове? Няма как да стане без външна помощ!

Ако просто закръглим новата стойност за да продължим обработката със същата разрядност очевидно ще изгубим част от сигнала и звукът ще бъде тотално деградиран! А при всяка обработка разрядността на резултата расте неимоверно – например за да увиличим нивото с 1 dB сигналът трябва да бъде умножен по 1.122018454 (с точност до деветия знак). Тогава нашата стойност 1.51 ще се превърне в 1.694247866 - със 7 знака повече!

Така откриваме основната тайна на цифровия звук[редактиране]

Сега вече знаете тази тайна: разрядността непрекъснато расте! След като е толкова просто, защо тогава производителите го пренебрегват? Процесорите могат да извършват аритметичните изчисления с повишена точност, като съхраняват междинните резултати във временни регистри на паметта, но това ги забавя и усложнява целия процес. Създателите на софтуер са принудени от пазарните механизми да предложат повече функции в малко място и на по-ниска цена... Така въпросът за качеството на звука и нежеланите изкривявания от дискретизацията отстъпва пред ценовата политика...

В един цифров миксер (хардуерен или софтуерен) крайната шина трябва да бъде с максимална разрядност, тъй като сумирането на две 16-битови числа и умножаването им с някакъв коефициент (нивото на мастър фейдъра е именно този коефициент) води до резултат с 32-битова или по-висока разрядност! Но тъй като стандартът AES/EBU използва 24 бита, то 32-битовото число се закръгля до 24 бита и така се изпраща към външния свят – хард диск или друг процесор... Следващата обработка обикновено се извършва отново с 32-битова разрядност, но на изхода отново трябва да се закръгли до 24 бита. Така системно се натрупва грешка от закръглянето и това неминуемо води до влошаване на качеството.

Сливи за смет?[редактиране]

Да предположим, че изходния сигнал трябва да се запише на 16-битов носител – CD. Би било напростим компромис просто да орежем 24-битовия сигнал до 16 бита - изгубените 8 бита съдържат важна звукова информация! Любителите обикновено постъпват точно така защото не искат да ползват услугите на квалифициран мастеринг инженер! А той би конвертирал разрядността без на практика да загуби информация чрез подходящо прилагане на дитър-технологията, използвайки специфични варианти на дитър в зависимост от всеки конкретен случай.

От къде да започнем?[редактиране]

За да запазите цялостния звук на микса си непременно трябва да следвате простите правила:

Не променяйте нива, освен ако редактирате две пиеси заедно! Никога не изпозвайте нормализация (функцията normalize) защото тя представлява именно промяна на ниво, при това по най-неправилния начин – чрез орязване (truncation) на ниските по йерархия битове, а именно в тях се съдържа детайлността на звука! Не използвайте икуълайзъри – освен фазовите изкривявания те внасят и съществени промени на нивата! Не прилагайте fade-in или fade-out – само редактирайте до фазата микс!

Оставете преходите, затихванията, промените в нивата за мастеринг студиото, където специалистите могат да работят с повишена разрядност! Не ви ли се е случвало направено от вас затихване на песен да звучи неестествено – като скок на комплексар с бънджи!?!

Малко шум, пък голям ефект?[редактиране]

Шум с ниво -96 dB е наистина практически незабележим! Но въпреки това всеки слушател, дори без да е опитен тонрежисьор, веднага отчита ефекта от правилно подбрания дитър дори когато слуша с много ниско ниво! Дитърът реално ни помага да съхраним естественото акустично звучене. За жалост, когато не е правилно използван или след прилагането му са извършени обработки по ниво или честота (респективно – фаза на сигнала) ефектът може да бъде напълно обратен: мътна и глуха звукова картина, макар високочестотните компоненти да присъстват в изобилие! Проверявате със спектрален анализатор и се убеждавате, че в материала има високи дори повече от необходимото, а парчето звучи мътно... Неприятна работа... И всичко това идва от обикновено отсъствие на елементарни познания по физика и математика!

Подобрени Дитър-трикове[редактиране]

Въпреки че необходимата амплитуда на дитъра е около -96 dB, при добро желание е възможно да се намали възприемането му като шум чрез подходящо преразпределяне на спектралната му плътност. Така наречената noise-shaping техника цели именно това, като запазва общата спекрална плътност, но премества максималните пикове на дитъра встрани от честотните области, в които човешкото ухо е най-чувствително (около 3 kHz) към най-високочестотния диапазон (10 до 22 kHz), в който присъствието на този целенасочено добавен шум не може да бъде забелязано! Както например в една от най-успешните спектрални обвивки на дитър, разработена от Meridian Audio, Ltd. ясно се вижда, че са използвани прецизни филтри от много висок ред, изискващи изключително обемни изчислителни процедури. Резултатът обаче е ясна звукова картина, като фоновият шум е на практика незабележим! На тази графика нивото 0 dB отговаря на -96 dBFS.

На пазара се предлагат многобройни варианти на дитър с noise-shaping в софтуерен и хардуерен вид, като успешните използват свръх-прецизни 72-битови изчислителни процедури за оформяне на спектъра. Тоест: в домашни условия е немислимо да се постигне дори задоволително професионално ниво! Резултатите от прилагането на така оформен дитър варират от много добри до направо граничещи с чудо! С най-добрите на практика не се чува никакъв шум! След критично слушане и внимателно обективно сравнение професионалистите по света се спират на избор между: db Technologies 3000 Digital Optimizer, Meridian Model 618, Sony Super Bit Mapping, Waves L2 и L3 Ultramaximizer, Prism, POW-R, плюс някои недотам популярни други. Например Apogee Electronics разработиха системата си UV-22 заради многобройните оплаквания от звука на предходните им дитър-технологии. От фирмата не използват термина дитър, а наричат шума си сигнал, тъй като при тях не е със случаен характер, а в голяма степен периодичен. Вместо noise-shaping системата UV-22 прилага внимателно изчислен шум около 22 kHz без да променя шума в средно-честотната област. Интересно техническо решение, но основният му недостатък (поради тоналния характер на използвания шум) е неизбежната поява на интермодулационни изкривявания във високочестотната област, които обикновено се изразяват в неестествено, “стъклено” звучене…

За обективно сравняване с цел избор измежду различните форми на дитър (ефекта им върху звука) се прилага относително проста процедура: - избирате откъс от добре записана музика с голям динамичен диапазон (акустичен джаз или класика) с продължителност 1 минута;

- конвертирате така получения файл в 24-битов формат;

- прилагате fade-in и fade-out с времетраене 5 секунди;

- добавяте пълна тишина 250 ms в началото и в края на файла;

- редуцирате нивото с 40 dB;

- конвертирате в 16-битов формат, като използвате дитър с различна форма (от различни производители, в различни редакторски програми, с различни настройки на използваните плъгини и т.н.) и записвате всеки резултат в отделен файл със съответно подходящо име за целите на сравняването;

- слушате с максимално възможното усилване (поради умишлено ниското ниво на звука във файловете) на прецизните си монитори или качествени слушалки.

Само така ще можете да сравните ефективността на различните дитър технологии и в каква степен помагат да се съхрани разрядността на цифровия звук. Най-вероятно ще бъдете направо шокирани от звуковите разлики между различните системи! Някои ще ви звучат неестествено грубо, при други ще дразни наличието на шум, трети ще имат нелинейни изкривявания в резутат от недостатъчно добре обмислен дитър или неточна изчислителна процедура... Победителят в такъв тест очевидно ще бъде вашият избор за дитър! Предупреждение: не се вживявайте прекалено в наличието на шум в най-високочестотната част от спектъра, който може да се чува при такова неестествено голямо усилване (поради съзнателно редуцираните нива на записа), тъй като с нормално усилване при слушане на добре записана музика този шум изобщо няма да бъде забележим!


За тези, които са пропуснали смисъла на теста: НЕ, НЕ МОЖЕ да повдигнете обратно нивото на записа, тъй като с това ще повдигнете и нивото на дитъра и той няма да действа като такъв, а вече ще бъде само един гаден и неприятен шум! Трябва просто да се слуша с повече усилване от апаратурата за възпроизвеждане! Естествено, такъв тест не може да бъде проведен с апаратура от нисък или дори среден клас – с нея всички варианти ще звучат подозрително еднакво! Няма да се получи и с вградения звуков чип-сет на преносим компютър (лап-топ) – поради основното изискване за намалена консумация на енергия при тях изходните усилватели просто не могат да възпроизведат без изкривяване нищичко! Единственото решение е в ползването на аудио интерфейс по fire-wire или USB интерфейс.

Наричат го “не-деструктивно”, пък ми скапва звука...[редактиране]

Преди навлизането в дигиталната ера всяка редакция в процеса на записа беше деструктивна – прилагането на компресори, икуълайзъри и т.н., монтирането на пасажи и други операции променяха безвъзвратно записания материал. В крайна сметка това беше целта, нали!?! С компютърните работни станции стана възможно да се връщаме назад и да променяме операции, направени много стъпки назад във времето. За жалост, повечето хора, които ползват компютърна система за звукозапис не си дават изобщо сметка, че именно така нареченият “не-деструктивен” подход драстично деградира качеството на звука поради невъзможността да се запази разрядността на сигнала, както по-горе се убедихме – вследствие на груби закръглявания, невъзможност за прецизни последователни изчисления, както и заради неизбежните операторски грешки от непознаване на прилаганите математически алторитми... Е-е-е-е, ама нали не е възможно всички да са едновременно брилянтни инженери и отлични музиканти!?!

Тогава какъв подход ще ни спаси?[редактиране]

За да запазим качеството на цифровия звук непокътнато през цялата поредица от процедури от началото на записа, през редакцията и обработката по тракове, смесването, та чак до мастерирането – задължително трябва да запазваме пълната разрядност (wordlength) на сигнала на изхода на всеки един използван цифров процесор, независимо дали е хардуерен или софтуерен! Просто не можем сляпо да се доверим и трябва да правим нужните проверки! Не вярвайте дори на режима BYPASS , преди обективно да сте проверили, че въпросният процесор или софтуерен модул осигурява напълно идентично копие в този режим! На следващите илюстрации ще видите спектъра на синусоидален сигнал с честота 1 kHz след два различни подхода при конвертиране – на първата виждаме резултата от BYPASS режим на доста популярен плъгин, а на втората е показан резултата от прилагане на най-обикновен равномерно разпределен триъгълен дитър: (just visit: http://www.myspace.com/boro_mastering) Очевидните нелинейни изкривявания в първия случай са добавили множество нежелани нечетни хармонични компоненти, с наличието на които звукът ще бъде груб, неестествен и замъглен! Значи си струва доста да внимаваме!!! Иначе такова “замърсяване” ще се случва всеки път, когато приложим някаква обработка на сигнала, като отгоре на всичко изкривяванията ще се сумират в микса... За какво качество можем да говорим?

Натрупване на дитър? Май хич не е добре...[редактиране]

Разбрахме как да запазим качеството при запис, редакция и обработка по тракове, смесване и т.н., но няма ли скрита уловка? Параграф 22 в действие? Има, и още как – приложеният дитър при последователните обработки на един трак (да речем - вокал) се добавя и натрупва при всеки следващ процесор или плъгин – Low-Cut, Fast Limiter, Compressor, EQ, De-Noiser, De-Esser, няма да изброяваме всичко, което се прилага при обработката на вокален трак. В резултат вместо желания от нас дитър, който да съхрани разрядността и респективно – качеството на звука, ще имаме сумата от всички приложени дитър-шумове, която очевидно няма да бъде с желаното ниво, да не говорим за очакваната ефективно разпределена спектрална плътност! Значи и крайният звук ще бъде с недопустимо ниско качество!!! Позната родна картинка...

Именно затова се налага всеки индивидуален трак да бъде обработен, кондициониран и подходящо редактиран в специализиран за това софтуер за аудио-редактиране (SoundForge, Wavelab и др.) преди да започнем процедурите по смесването на пиесата! Само си представете какво ще се случи с дитъра от лимитера след като бъде обработен с компресор – очевидно нивото му ще се покачи драстично и той не само няма да работи по предназначението си, но и ще се превърне в неприятен шум, замъгляващ звуковата картина! Единственото разумно решение се натрапва само – след максимум две операции да се отърваваме от дитъра, след като вече си е свършил работата. Това не може да стане напълно, нито трябва да очакваме идеален вариант, но непременно трябва да се избавим от възможността за натрупване на дитър! За целта можем да използваме някой от многобройните самообучаващи се плъгини за обезшумяване (Sony Noise Reduction, Waves X-Noise или още по-добре Z-Noise), като съвестно запаметим сетинги за различните по форма варианти на дитър, което в бъдеще страхотно ще облекчи работата ни! Трябва обаче изключително много да се внимава (в режим Keep Residual Noise) обезшумяващият плъгин да не “краде” от полезния сигнал!

Най-добре е финалния дитър да се остави за мастериращия инженер, но ако сте решили да се пробвате сами да мастерирате – предвидете го като последна операция по завършване на музикалния продукт!