Восстанавливаем старые записи

2 Февраля 2015
Не так давно на Хабре проскакивала новость о том, что учёным удалось восстановить одну из очень старых записей, сделанную ещё в 1905 году, не повредив при этом носитель. Основным достижением тут является как раз факт целостности носителя, так как запись сделана была не абы на чём, а на восковом цилиндре. Это чуть ли не самый первый изобретённый способ записи\воспроизведения звука, который широко использовался. До этого носителем были стеклянные цилиндры с сажей (воспроизводить их правда не умели), затем покрытием стала фольга и лишь потом воск.

Я, разумеется, заинтересовался таким-то раритетом и решил послушать как там люди вообще жили-то, в далёком 1905-ом...К моему удивлению, оригинальная запись оказалась достаточно шумной, хоть и утверждалось, что она была обработана различными шумоподавляющими алгоритмами и т.д... Стоит отметить, конечно, что по сравнению с другими восстановленными с восковых цилиндров записями, эта действительно была весьма хороша - по качеству уже вполне сопоставимо с первыми пластинками. Однако, как известно, лучшее - враг хорошего.

Я вообще любитель старых довоенных песен, и зачастую приходится немного обновлять звук добытых из глубин сети экспонатов. В частности, например, этим страдают записи песен из старых фильмов, так как там и сам оригинал фильма не блещет качеством звука.

В рассматриваемом нами случае, мы имеем, фактически, слепок дорожки, сделанный лазером. Я сейчас не рассматриваю тот факт, что господа археологи тоже применяли какие-то процедуры к исходному звуку, однако буду считать что они пытались максимально точно воспроизвести оригинал. Так как линейные размеры дорожки, в данном случае, достаточно велики, говорить о погрешностях оцифровки практически не приходится, тем более для исходного файла выбрана достаточно высокая частота дискретизации, примерно в четыре раза превышающая частоту звуков в записи. Значит можно считать, что перед нами практически идеальный слепок оригинальной звуковой волны.

Тут мы сталкиваемся с особенностями материала и самого способа воспроизведения.

Факт номер раз: материал, из которого сделан цилиндр достаточно мягок (воск), на нём, даже будь он идеально новым, невозможно запечатлеть звуки с длинной волны меньше определённого значения.
Факт номер два: помимо материала вносит свои коррективы и сама технология записи на такие цилиндры - звук писался буквально иглой по цилиндру.
Факт номер три: воспроизведение такого цилиндра само по себе разрушало носитель.

Первый факт даёт нам ограничение максимальной частоты записи примерно в 5-6 кГц и, как мы увидим в дальнейшем, это очень важно. А второй и третий факт сообщают, что о сохранении крутизны фронтов и форме волн можно особо не беспокоиться - не та точность, изначально.

Для начала включим спектральное представление сигнала и возьмёмся за эквалайзер (а эквалайзер это ведь наше всё).

Что мы видим на спектрограмме? Частота дискретизации файла у нас аж 22000 кГц, при этом никаких звуков в записи, как мы видим, нет выше 4.5 кГц, чего и следовало ожидать (см. факт номер раз). Однако, если присмотреться повнимательнее, какая-то грязь всё-таки просачивается выше (чтобы лучше было видно, повысил контрастность и яркость в квадрате, обведённым красным). Откуда оно берётся непонятно, но не вдаваясь в детали мы первым же делом можем с чистой совестью порзать всё выше т.н. "частоты Найквиста" для нашей частоты дискретизации (11 кГц). Так как запас там ещё приличный, я не стал мелочиться и убрал всё выше 8 кГц, а также ниже 100 Гц, так как там, судя по спектрограмме, тоже ничего дельного не было.

Немного поразмыслив, я подошёл к этому моменту ещё более радикально, а именно - не стал морозится с эквалайзером, а начал всё с начала и сразу изменил частоту дискретизации файла до 11 кГц.

Далее, не мудрствуя лукаво, воспользуемся инструментом, который есть во многих современных аудио-редакторах: Noise Reduction. Идея проста - выделяем место в треке, где у нас нет ничего кроме шумов. Далее создаём паттерн этих шумов (Capture Profile). В простейшем случае вам будет достаточно одного единственного ползунка Noise Reduction Level.

Он там, правда, говорит, что у них, якобы движок обновился (речь о версии CS5.5) и они теперь умеют не создавать лишних артефактов при шумоподавлении, но, мы-то с вами знаем, что разница практически отсутствует. И настройки все те же, разве что окошко в новой версии перерисовали.

Есть ещё некоторые нюансы которые этот харизматичный мужик в видео не затрагивает, например "ширина окна" для преобразования Фурье (FFT Size).

Ширина окна влияет на частотное и временное разрешение сигнала - при увеличении ширины окна повышается частотное разрешение, но уменьшается временное разрешение и увеличиваются вычислительные затраты на выполнение быстрого преобразования Фурье.

Если не вдаваться в подробности, при избавлении от случайных (это важно) шумов, следует стремиться использовать как можно большее число точек (Snapshots in profile) при максимально возможном на данном отрезке FFT Size. Всё это значит, что для качественного "шумового профиля" нам нужен как можно более длинный отрезок, в котором есть только шумы. Вообще, чем хорош Noise Reduction, так это тем, что его можно использовать не только для шумов, но и для различных фоновых звуков (шум леса, дождя, etc.)

На самом деле, в том же SoundForge есть и более интересные инструменты, например возможность вычитать из сигнала волну произвольной формы, но я начинал пользоваться Audition"ом, ещё в бородатые времена, когда он звался CoolEdit, и тогда SoundForge даже близко ничего похожего не мог, а теперь мне уже лень браться за что-то новое.

Я привычно взялся искать в файле отрезок с шумами, но оказалось, что они слишком короткие и при формировании выборки по ним, можно было составить только слишком короткие паттерны. Из-за этого либо шумоподавления не было слышно вообще, либо появлялись дичайшие артефакты. Тут я стал думать как же мне с этим быть. А пока думал, решил зайти с другого конца.

Самыми раздражающими в нашем случае являются мягкие щелчки, а также периодичный шум, следующий сразу за щелчками. Я думаю этот эффект появился вследствие отклонений поперечного сечения цилиндра от формы круга, либо ось не ровно стояла. В какой-то момент, при записи, иголка слишком глубоко входила в воск (начальный щелчёк) и дальше короткий отрезок шла по неровности (продолжающийся несколько раз после щелчка характерный шум), далее цилиндр делал полный оборот и шум повторялся. Как мы увидим далее, от этого шума нам всё-таки удастся избавиться с помощью Noise Reduction, однако продвигаясь по файлу и просматривая форму волны, я заметил, что тут присутствуют ещё и достаточно странные косяки, похожие на характерные искажения A\B-усилителей. Очень характерный пример на заглавном скрине статьи, но там ещё достаточно спорно, так как у того искажения слишком длинный период (я выбрал наугад из файла). А вот на следующем скрине видно очень хорошо что я имею ввиду.

О том как эти штуки (не )надо лечить и почему, я решил написать отдельно, а чтобы статья слишком не разрослась, спрятал под спойлер. Можно пропустить этот кусок, это почти что лирическое отступление.

О том, как убирать искажения не надо и почему

На скрине выше не очень хорошо видно, так как я чуть отодвинулся для масштаба, но длительность такого колебания - жалкие 80 микросекунд. Проделываем нехитрые вычисления:

T = 0.00008 мс (период)
F = 1 / T = 12500 Гц (частота)

Самое время вспомнить первый факт, озвученный ранее: очевидно, в подобной записи 12-ти килогерцам взяться неоткуда, так что практически наверняка это тоже шумы. Тут можно было бы обратиться к спектрометру, однако, так как эти колебания имеют совсем уж мизерную амплитуду, а кроме того, их, почему-то, слишком много, на спектральном представлении они совершенно не выделяются и похожи на тёмный-тёмный точечный фон (картинка с более контрастным квадратом это как раз оно и есть).

Врядли такие косяки возникли из-за движения иглы. Я полагаю это микро-трещины на воске, которые появились, скорее всего, из-за времени.

В идеальном случае, может показаться будто было бы круто просто взять и вырезать такие места, причём целыми периодами: так как эти колебания приходятся на места, где у нас фактически дефекты записи, однозначно можно сказать, что никакой полезной информации они не несут, а так как нам не принципиально сохранение оригинального тайминга композиции, мы могли бы смело их удалять - в среднем они длятся не более 100 мкс, это совершенно мизерный промежуток, на слух такое заметить нереально.

Только вот, живём мы не в идеальном мире (хотя, это как посмотреть), так что это достаточно скверная идея. Дело в том, что при удалении участка, происходит т.н. smoothing, т.е. сглаживание уровней соседних точек. Так как это у нас цифра, такие мельчайшие неровности после сглаживания это самый натуральный В/Ч шум. Мы его немного ограничили снизив частоту дискретизации файла, но тем не менее. Тут можно было бы попробовать порезать такой шум эквалайзером после всех удалений, но, опять же, это изменит форму волны, а в силу того что звук у нас цифровой, тут всё упирается в математику - сделать эквалайзером ровный срез по нужной частоте просто так не получится. Кроме того, как я говорил выше, таких искажений слишком много, отчего ручками вот так всё править практически бессмысленно - такие фрагменты имеют длительность порядка 100 мкс, а значит для того чтобы это "улучшение" было хоть немного заметно на слух (теоретически), вам нужно удалить просто невероятное количество таких участков. При этом, так как в остальном файле эти искажения никуда не денутся, "чистый отрезок" в пару миллисекунд будет банально незаметен на фоне шумных. И ещё бочка дёгтя - результаты сглаживания сотен удалённых отрезков создадут такой шум, что первоначальный вариант (который был без правки) покажется вам даже лучше того что у вас в итоге получится.

Помимо всего перечисленного, волны порой интерферируют друг с другом совершенно невообразимым образом (простите за тавтологию), отчего однозначно понять где конкретно искажение, а где, скажем сибилянты, очень сложно - для этого, как минимум, нужно хорошо знать особенности человеческой речи, формирование гармоник и всё остально. Так что, даже если бы не smoothing, при таком удалении есть неиллюзорный шанс банально попортить изначальный звук, сломав интерференционную картину.

И тем не менее, лекарство от данных болячек есть - ниже я покажу как подчищать звук, в том числе и от подобных искажений.

В один из моментов, когда я рассматривал спектрограмму сигнала, до меня дошло, что в конце песенки, есть достаточно длительный момент, когда ничего, кроме "свиста птиц", не звучит. А свист этот на спектрограмме имеет вполне однозначную полосу.

А значит мы можем схитрить. Расчехляем эквалайзер, выставляем максимальный Range (это динамический диапазон, говоря проще, на сколько дБ будет усилена\ослаблена та или иная частота) и режем частоты на которых у нас поют птицы, а всё что ниже\выше оставляем.

Так как даже максимального динамического диапазона не хватает чтобы полностью прибить всех птиц, повторяю эквалайзер дважды. Вообще, про то как он работает, и почему так всё происходит, можно отдельную статью писать, только, боюсь, я не настолько хорошо знаю математику алгоритмов чтобы на эту тему умничать.

Итак, теперь мы имеем достаточно длинный отрезок с одним лишь шумом... и, правильно, возвращаемся к тому, с чего начинали. Захватываем профиль шума (после захвата нажимайте close, а не cancel, ибо иначе все настройки сбросятся к предыдущим использованным).

Помимо Noise Reduction, ещё есть фильтр Hiss Reduction, он, как следует из названия, поможет нам избавиться от свиста и всякого разного подобного. Настройки там почти аналогичные шумодаву, разве что FFT Size как-то по другому работает, а как именно я так и не разобрался, поэтому действую тут эмпирическим путём, чего и вам советую. Для Hiss Reduction тоже необходимо указать базовый уровень шума (кнопка Get Noise Floor), так вот, этот базовый уровень захватывать стоит на том же отрезке, на котором мы захватывали шумовой профиль.

После применения этих двух разновидностей шумодава, мы получаем уже вполне годный к потреблению результат. Разве что, небольшие артефакты на концах спектра появляются. Тут нам на помощь снова приходит эквалайзер - нещадно режем всё ниже 150 Гц и выше 4.5 кГц.

Стало заметно тише, но щелчки до сих пор слышны. Теперь в дело снова идёт спектрометр. Если на данном этапе послушать файл и наблюдать за спектрограммой, будет очевидно, что в момент щелчка шум имеет весьма широкий спектр, а вот мелодия, напротив идёт чёткими волнистыми линиями (ниже, для наглядности выделил один щелчок красным).

Для начала устраним апмлитудные всплески на местах щелчков. Для этого переключаемся в режим отображения формы сигнала. Как правило, это всего один "зашкаливающий" период волны.

В случае, если этот период был просто слишком громким, то я обычно просто делал его тише. Если он был ещё и сильно искажен, то удалял целиком (лень выправлять каждый, чего уж тут).

А тут я расскажу как буквально в два щелчка править амплитуду таких скачков.

Хинт о том, как удобно юзать избранное в Audition

Собственно, идея тривиальна. В Audition для произвольного участка записи мы можем задавать определённый график изменения громкости (Amplitude and Compression -> Envelope). Т.е. например можем сделать плавное затухание, или резкое появление. Ну в общем, нарисовать можно, что душе угодно. Обычно этот инструмент применяется для больших масштабов. Однако, я придумал как его можно использовать на микромасштабах. Открываем "Избранное" (Окно->Избранное) и создаём новый пункт. Выбираем эффект Envelope и правим настройки. В настройках создаём простейший график-дугу, с одной единственной точной-минимумом ровно по центру графика (50% время, 50% амплитуда). Придумываем имя, сохраняем и двигаемся к нашему первому щелчку.

Теперь вам надо всего лишь выбрать на максимальном приближении один период волны "щелчка", который зашкаливает и два раза щёлкнуть по созданному эффекту в избранном. Вуаля - щелчёк по уровню становится примерно равен окружающим его колебаниям. Этакий "ультрапрецизионный софтлимиттер". В принципе можно добиться аналогичного эффекта и Hard Limiter"ом, но он порежет под один уровень все звуки в треке, а нам надо резать только ненужные. Кроме того там ещё есть ряд нюансов - например часто просто невозможно подобрать такие настройки, при которых лимиттер режет только то что нужно, например, когда щелчки слишком резкие.

После того, как самые громкие щелчки были побеждены, пришло время избавляться от мелких искажений, которые есть по всему файлу. В предыдущем спойлере я уже рассказал как их удалять не стоит, а сейчас расскажу как делать это более-менее правильно.

Тут нам снова пригодится спектральное отображение сигнала. Если зорким взором окинуть панель инструментов в этом режиме, в глаза бросается вещь, вроде бы совсем не связанная с миром аудио-редакторов. Кисть. Она-то нам и нужна.

Она позволяет удалять произвольные участки на спектре. Будто динамический сверх-точный эквалайзер.

Помните я писал, что щелчки имеют широкий спектр, а вот музыкальные звуки хорошо читаются на их фоне? Сейчас мы этим и воспользуемся. Выбираем эту кисть, ищем момент где у нас идёт такой вот столбик шума на фоне музыки. Далее рисуем этой кистью в местах где у нас только шум, не затрагивая при этом музыкальную линию. Далее нажимаем del, затем передвигаем ползунок выделения чтобы просмотреть чё у нас получилось, либо просто начинаем рисовать кистью на новом месте. И видим что там, где только что удаляли, у нас теперь темнота, то есть тишина.

Только это неблагодарное занятие, на самом деле. Потому что в реальности звуки имеют гораздо более сложную природу и помимо шумов между главными гармониками часто присутствуют менее важные призвуки. Но несмотря на то, что они менее важны, они придают звуку более естественный окрас и характерность, чего можно лишиться, если приняться выпиливать вообще все не гармонические звуки.

Кстати, помните я писал про то, что при удалении периодов появляется некий шум, которому вроде как и взяться неоткуда? Долго работая кистью в спектрографе, можно заметить что даже в этом режиме такой шум тоже иногда появляется - вокруг удалённой области непонятно откуда появляются белые участки - это оно и есть.

Внимательный читатель, наверняка ещё задаётся вопросом, а почему я, для того чтобы получить профиль шумов (там где "свистят птицы") использовал эквалайзер, а не эту "кисть", коль скоро там ничего, кроме свиста нет?

На самом деле вопрос хороший, так действительно можно было бы сделать, но мне, во первых лень было обводить всю огибающую, а во вторых, т.к. свистит тут у нас не идеальный синтезатор, остаётся вероятность наличия в свисте дополнительных гармоник, которые также присутствуют и в остальной песне. А если мы посчитаем на их основе шумовой профиль, то, очевидно, ошибочно избавимся от них при обработке. Хотя, на самом деле, конечно, основную роль конкретно в этом случае сыграла моя лень...

Итак, в качестве финальных штрихов прогоняем Automatic Click remover в режиме чуть сильнее среднего (верхний ползунок 30, нижний 75) - он уберёт резкие щелчки, которые могли появиться в результате наших манипуляций. И эквалайзером ещё раз срезаем всё выше 5 кГц и ниже 100 Гц. Далее нормализуем файл до 100%. Я ещё удалил самое начало файла, буквально полсекунды где-то, там всё равно после всех наших манипуляций ничего не осталось.

Кстати, в оригинальной статье не было упоминания, да и теги в файле проставлены не были, исполнители оригинала: Harlan And Belmont.
А Byron Harlan даже есть на

Анатолий Вейценфельд: Начнем с общих подходов к реставрации звука. Что мы в имеющейся фонограмме пытаемся спасти, стараемся вытащить, а чем мы можем пренебречь, оставить как есть? Возьмем для примера виниловые грампластинки - что мы можем с ними сделать имеющимся на сегодняшний день инструментарием?

Алексей Лукин: Виниловые пластинки - достаточно популярный случай, потому что сегодня их реставрацией занимаются не только профессионалы, которые не смогли найти мастер-ленты (или их вообще уже нет), но и любители, которые собирают пластинки, но хотят сохранить этот приятный потрескивающий звук для своей коллекции на айпаде, к примеру. Это по-английски называется needle drop, когда оцифрованные пластинки слушают на компьютере.

Первое, о чем хотелось бы сказать, говоря о виниле - что винил очень важно правильно проиграть. До того, как пойдет речь о качественном АЦП, о программах - важно хорошо очистить пластинку. Некоторые используют воду и мягкую тряпочку, другие применяют специальные клейкие составы, чтобы потом снять этот клейкий состав вместе с пылью, некоторые доходят до "мокрого прослушивания", когда проигрывание ведется с влажной и даже покрытой водой пластинки… в общем, способов много, об этом есть литература, рассказы реставраторов.

Предположим, что материал пластинки уже "снят ", оцифрован с максимальным качеством. Какая последовательность действий по реставрации?

Первое, с чем мы сталкиваемся в такой записи - это подавление щелчков. Для пластинок, особенно старых, потрепанных - это наиболее заметная помеха, которая, в свою очередь, мешает подавлять другие помехи, такие как шум, сетевая наводка. Поэтому первое, чем занимаются, - это подавление щелчков и тресков. Для этого существует множество программных продуктов, из лучших: iZotope RX, Click Repair - недорогой качественный конкурент RX в области работы со щелчками (если не нужны все функциональные возможности RX), CEDAR - это уже дорогая аппаратная Hi-End система реставрации, но существующая также в виде плагинов для SADiE, а теперь и для Pro Tools.

Начинать работу с фонограммой пластинки надо с автоматического декликера. Он в реальном времени находит щелчки и подавляет все, что смог найти. При обработке записи декликером я рекомендую сделать пару проходов, потому что иногда оказывается так, что на первом проходе после подавления одного мощного щелчка могут обнаружиться несколько мелких щелчков вблизи него, потому что декликер их не заметил. Поэтому два или даже три прохода могут улучшить качество очистки.

Второе - это удаление того, что мы на iZotope называем crakle. Так мы называем не отдельные щелчки, скажем 10 в секунду, а непрерывный поток сливающихся по времени щелчков, которые звучат уже почти как шум, но все-таки не ровный шум, а такой "песок", то есть мелкие-мелкие щелчки, идущие очень часто по времени. Для него также есть автоматический процесс De-Crackler. Он аналогично декликеру очищает очень мелкие щелчки, которые декликер мог пропустить. Однако декликер и декраклер основаны на разных принципах работы и потому могут дополнить друг друга, - если одному методу что-то оказалось не под силу, тогда другой может прийти на помощь. Вообще при обработке звука я часто советую использовать разные инструменты. Если действуют и один и другой, например, denoiser и deconstructor (это тоже модуль для шумоподавления), и оба дают хорошие результаты, можно их смешать в какой-то пропорции или последовательно прогнать с большей и меньшей силой, и тогда их достоинства складываются.

Но вернемся к винилу. После того, как подавлены щелчки и мелкий "песок", я рекомендую проверять запись на стереобаланс. Часто бывает так, что запись на виниле - монофоническая, а играется пластинка на стереопроигрывателе. Если игла проигрывателя подобрана хорошо, то такое воспроизведение - скорее достоинство, потому что царапины в канавке не симметричны и щелчки оказываются в разных каналах, в то время как полезная запись будет звучать по центру стереопанорамы. Это позволяет более эффективно подавить как щелчки, так и стационарный шум.

Как этим можно воспользоваться? Первым делом нужно удостовериться, что полезный сигнал звучит по центру стереопанорамы. Если это не так, то есть каналы не совсем сбалансированы или игла не вполне вертикальна, (это могут быть недостатки проигрывателя или предусилителя-фонокорректора), то следует выровнять баланс по амплитуде.

Еще одним важным моментом согласования каналов является выравнивание азимута. Это понятие пришло из магнитофонной записи, и означает выравнивание задержки между левым и правым каналами, чтобы запись полезного сигнала оказалась по центру не только по амплитуде, но и по времени. Можно, конечно, вручную подбирать задержку, можно использовать стереогониометр или вектороскоп, которые покажут, центрирована запись или нет, но можно воспользоваться программным инструментом, который называется азимут-корректор. Он находится в разделе канальных операций. Азимут-корректор позволяет автоматически на основе анализа фонограммы подобрать как уровни каналов, так и сдвиг по времени. Выравнивание благодаря ресемплингу и оверсемплингу производится с точностью до одной сотой отсчета (семпла), чего невозможно достичь вручную. Поэтому когда дорожки будут сложены в моно, не возникнет завала высоких частот.

После того, как мы выровняли каналы, можно применить MS-кодирование, то есть сложить дорожки и получить моно, и вычесть их друг из друга и получить разностный канал, и обработать их независимо. Если известно, что запись моно, можно Side-канал отбросить, в нем только шумы и треск, а Mid-канал, то есть полусумма левого и правого каналов, содержит полезный сигнал. Вместо MS-кодирования можно воспользоваться новой опцией RX 3 - это извлечение из записи центрального канала. Это позволяет более эффективно, чем при MS-кодировании, извлечь звуки центрального канала. Если мы применяем просто MS-кодирование, то в М-канале те шумы и щелчки, которые были в S-канале, уменьшаются на 3-6 дБ, а с помощью специального инструмента по извлечению центрального канала уровень щелчков можно уменьшить децибел на 20. Этот инструмент разработан для извлечения из песни вокала, который находится по центру. Можно просто сложить в противофазе две дорожки, но тогда аккомпанемент понизится примерно на 3 дБ, а с помощью этого инструмента можно подавить звуки не по центру стереобазы более значительно.

Все это относится к случаям, когда известно, что на пластинке запись моно. В случае с стереозаписью можно перейти к подавлению шума. Для шумоподавления существует несколько инструментов. Самый очевидный - это денойзер. Он хорошо работает в тех случаях, когда шум является стационарным или постоянным по времени, не меняется по мощности и спектру. В этом случае денойзер "обучается" по фрагменту шума из фонограммы и применяется ко всей записи. Если же на пластинке имеются фрагменты, которые повреждены сильнее других или с которыми не справился декликер на первом этапе, то необходимы дополнительные операции. Например, для плохо подавленных или длинных щелчков следует применять инструмент Spectral Repair (спектральный ремонт). Там есть несколько режимов, позволяющих как уменьшить амплитуду выделенного звука до слияния с окружающим фоном, так и полностью ресинтезировать выделенный фрагмент на основании окружающего материала, заменив его на синтетическую "заплатку", которая во многих случаях звучит вполне реалистично. Спектральный ремонт эффективно работает не только над фрагментами, выделенными по времени, но и по частоте и времени, когда помеха ограничена по спектру определенным диапазоном частот.

Но вернемся к подавлению шума. Если оказывается, что шум на виниловой пластинке существенно меняется во времени, то денойзер в этом случае будет не очень эффективен и придется поработать вручную. К тем участкам, где шум повышается по уровню, можно применить денойзер с более высоким порогом. В расширенной (advanced) версии RX 3 есть функция Dialog Denoiser. Он отличается от обычного денойзера более простым управлением и удобной автоматизацией. Он позволяет в реальном времени менять шумовой профиль, и если автоматизировать шумовой профиль согласно тому, как меняется уровень шума в пластинке, например, нарисовать периодическое изменение шумового профиля, то можно более аккуратно подавить этот шум.

Еще одно средство, которым можно пользоваться, если шум меняется по времени - это модуль Deconstructor. Он разделяет сигнал на тональные и шумовые составляющие. В отличие от денойзера, он позволяет разделить их не только по уровню, но отделяя тональные от шумовых составляющих. Например, если у нас есть запись флейты в помещении, то денойзер, проанализировав шум помещения, удалит его из записи, а Deconstructor не обращает внимания на уровень сигнала, поэтому он из флейты выберет только гармоники и позволит подавить, например, шум дыхания или звук воздуха, выходящий из клапанов.

Но такая "дистилированная очистка " уже может быть искажением реалистичности звучания…

Совершенно верно, это инструмент опасный, его нужно применять в таких местах, где известно, что весь шум - нежелательный. Если же есть шум, являющийся частью полезного сигнала, например, щетки для барабанов или согласные шипящие звуки, применение деконструктора не оправдано. Его надо применять только к выделенным фрагментам, а не ко всей записи.

Еще один инструмент, который можно применять, когда шум меняется по времени - это уже упомянутый "спектральный ремонт", можно выделять самые громкие участки шума и применять интерполяцию, горизонтальную или вертикальную, и уменьшать этот шум по уровню.

Вот это, пожалуй, самая распространенная цепочка операций по реставрации винила. По ситуации можно применять еще какие-то специфические инструменты, но подводя итог, можно сказать, что первым делом надо удалять щелчки и "краклы", а после этого удалять шум. Хотя, конечно, как и при любой реставрации, нужно соизмерять потери полезного сигнала со степенью удаления шумов. Опытные реставраторы всегда знают, что щелчки и шумы далеко не так мешают обычным слушателям, как им самим, потому что они привыкли отслеживать искажения, а для обычного слушателя щелчки и трески в старой записи привычны. Если они слишком громкие и мешают, их стоит подавить, Если они просто создают фоновую атмосферу, их не обязательно подавлять. Часто бывает достаточно просто убрать щелчки, не трогая слабый остаточный фоновый шум.

А какой формат оптимален для оцифровки винила?

Разрядность лучше брать максимальную, 24 бита, при этом формат файла может быть даже 32 бита с плавающей запятой, а может и 24 бит, это зависит от вашей рабочей станции, а частоты дискретизации 44,1 кГц вполне хватает для качественного звучания и для обработки теми инструментами, о которых я рассказывал. Высокие частоты дискретизации, 96 кГц и выше, не дают выигрыша в качестве реставрации пластинок.

Какой контроль лучше предпочесть при реставрации? Мониторы большие, маленькие, наушники?

В значительной степени это зависит от предпочтений реставратора, но большинство пользуется большими хорошими мониторами. Наушниками они пользуются только часть времени для определенных операций.

Но некоторые дефекты, мелкие щелчки, вот эту "сыпь " лучше слышно в наушниках…

Да, такие вещи лучше контролируются в наушниках, но полную картину и по завершении работы лучше слушать на хороших мониторах. Мониторы ближе к тому, на что ориентируются звукорежиссеры при создании записей. Хотя возможно, последнее время это постепенно меняется в сторону наушников.

Да, техническая реставрация - это все-таки лабораторный процесс, тут дело не в краске звука, которую могут дать мониторы, это работа непосредственно со звуковой информацией безотносительно каких-то художественных решений. Тут важно дефекты убрать, а не то, чтобы улучшить звучание, как при мастеринге. Поэтому главное, что мы должны услышать при реставрации - это все дефекты, весь мусор…

Да, я согласен. С чем удобнее звукорежиссеру-реставратору работать, то он и предпочитает. Но нужны разные виды контроля, по приборам контролировать невозможно.

Теперь поговорим о специфике и проблемах реставрации магнитной ленты. Они же тоже разные, есть ленты 1950-х годов, а есть 80-х. Есть студийные рулоны, а есть кассеты…

Да, все они значительно различаются уровнем шума, уровнем детонации. При оцифровке ленты как всегда начинаем с выбора аппаратуры. Профессиональную ленту следует проиграть на исправном профессиональном магнитофоне. Существует целая наука, как обращаться со старыми лентами, тут лучше обратиться к соответствующей литературе. Если речь идет о кассетах, то тут нужно иметь доступ к декам с низкой детонацией и профессиональным уровнем выходного сигнала.

Есть мнение, что нужно проигрывать кассету на том же экземпляре магнитофона, на котором она была записана, для полного совпадения азимутов головок…

Я с этим согласен только отчасти. Всегда важно знать, на чем кассета была записана и как это может повлиять на воспроизведение, и хорошо, если кассета оцифрована с того устройства, на котором она была записана, но бывает так, что проиграть ее на профессиональной деке лучше, чем внести детонации от проигрывания на плохом устройстве. Тут нужен компромисс и хорошо, если имеются оба варианта воспроизведения - оригинальный и профессиональный аппарат.

Когда запись уже оцифрована, то, первым делом, поскольку щелчков, как правило, нет, следует проверить, является ли запись действительно стереофонической или она близка к моно. Если это почти моно и стереокартинкой можно пожертвовать аналогично тому, как мы это проделали с винилом, следует отрегулировать азимут и амплитудный баланс каналов, а затем применить либо MS-кодирование, либо операцию по извлечению центрального канала. Это позволяет в значительной степени подавить шум, который для стереозаписи часто оказывается некоррелированным в левом и правом каналах. А далее следует подавить стационарный шум, поскольку это главный вид помех в магнитной записи. Такой шум вполне успешно подавляется денойзером.

А если запись обладает повышенным уровнем нелинейных искажений?

Если это особенность конкретной ленты или кассеты на протяжении всей записи, с этим вряд ли можно побороться, если зашкаливание имеет место только на отдельных участках, следует использовать деклиппер. Работает оно не всегда, но в большинстве случаев позволяет улучшить результат. В третьей версии RX в деклиппере были произведены некоторые улучшения как алгоритма интерполяции, так и пользовательского интерфейса. Теперь можно автоматически проанализировать гистограмму уровней звукового файла и программа предложит с помощью кнопки Suggest уровень, на котором происходит клиппирование, причем этот уровень можно установить как различным как для положительной, так и для отрицательной полуволны. Это важно для тех случаев, когда лента по-разному насыщается для положительных и отрицательных уровней намагниченности. С помощью такого независимого порога клиппирования можно более аккуратно сохранить ту информацию, которая еще не искажена и проинтерполировать только те участки, которые находятся за точкой клиппирования.

Но бывают искажения, которые возникли не от перегрузки по уровню, а по каким-то другим причинам, и находятся на невысоких уровнях - всякие рычания, хрипота, мутность. Можно ли это как-то прочистить?

Это сложная операция и, скорее всего, придется работать вручную. Я бы попытался применить два инструмента - Deconstruct и Spectral Repair. Deconstruct позволяет в целом отличить гармонические составляющие от негармонических и подавить их, хотя иногда негармонические составляющие являются частью полезного сигнала и инструмент их плохо различает. Но в целом Deconstruct позволяет "проредить" спектр и сделать его чуть менее "захламленным" мелкими звуковыми артефактами и оставить более крупные основные гармоники.

А как быть с низкоуровневыми сигналами, когда полезный сигнал слабо возвышается над уровнем шума - как здесь разделять полезный сигнал и шум - технически и, может быть, даже концептуально?

Очень сложный вопрос. Часто возникает проблема, когда кто-то говорит в петличку и задевает ее одеждой, и возникает шорох, смешивающийся с речью. Это шум нестационарный, он очень быстро меняется по времени и перекрывается речью, что не позволяет его просто уменьшить по уровню. Приходится вручную, пользуясь спектральным ремонтом, аккуратно выделять маленькие фрагменты и уменьшать амплитуду шороха. Также можно использовать Deconstruct, но опять же к выделениям, сделанным вручную. Хороших автоматических средств для таких случаев я не знаю.

Иногда при записи используют стереопетличку, в этом случае голос приходит с определенного направления, тогда с помощью азимут-коррекции можно расположить голос в центре и применить извлечение центрального канала. При этом, поскольку петличка стерео, левый и правый капсюли могут по-разному поймать шорохи и они будут более широко расположены по стереопанораме. Но это далеко не всегда срабатывает, это одна из самых тяжелых проблем при редактировании.

Не появились ли "лекарства " от детонации?

Хороших автоматических "лекарств" пока нет. Однако появились некоторые технологии, программно-аппаратные средства plunging process. Это системы для записи кассеты вместе с тоном подмагничивания. Это не только с кассетами применяется, но и для профессиональных рулонных лент. Запись производится с высокой частотой дискретизации с магнитофона, который не подавляет ток подмагничивания, и специальное программное обеспечение позволяет, используя флуктуации частоты этого тона подмагничивания, произвести ресемплинг, то есть передискретизацию записи, чтобы компенсировать детонации. Это очень правильный, я считаю, процесс, но для него требуется специальная аппаратура. К тому же он запатентован, так что реализовать это решение в других разработках не так-то просто, придется решать вопросы патентного права с авторами технологии.

Для исправления детонации без использования пилотного тона тока подмагничивания компания Celemony недавно выпустила программу Capstan. Она пытается, опираясь уже на изменения высоты собственно музыкального тона, выделить наиболее вероятную характеристику детонации и далее применить ее к записи, чтобы отменить детонацию. Здесь самое сложное, это понять - а какая же детонация была? Как отличить вибрато струнного инструмента от сползания всего оркестра? В случае если имеются проблемы со всем оркестром, факт и характер детонации установить легче, а в случае с сольным инструментом трудно отличить вибрато от детонации. По отзывам, пока эта программа не очень хорошо справляется в автоматическом режиме, но это направление перспективное и, думаю, будет дальше развиваться. Хотя по мере переноса старых носителей в цифровую форму актуальность такой работы будет уменьшаться. В целом можно сказать, что характер этой деятельности меняется от реставрации старых носителей просто к исправлению дефектов современных записей, которые вызваны не столько дефектами носителей, сколько сложными условиями записи - плохим помещением, посторонними шумами, а также клиппированием и другими отклонениями от правильной настройки тракта записи.

А мне кажется, поле деятельности для реставраторов очень широкое. Далеко не все еще оцифровано, многое находится в фондах и запасниках, всегда нуждаются в чистке даже самые последние концертные записи, есть бескрайние и часто очень интересные и ценные любительские архивы, не говоря уже о такой сфере применения, как криминалистика…

Теперь вопрос по современным носителям. В наше время нередко в качестве исходников приходится использовать компрессированные форматы файлов - МР3 и т.п. Какие здесь могут быть проблемы при реставрации?

Что интересно, значительная часть искажений, происходящих в форматах компрессии с потерей качества - это клиппирование сигнала, которое происходит при декомпрессии. Когда кодируется файл, нормализованный под 0 дБ и лимитированный с жестким порогом, то значительная часть отсчетов файла имеют амплитуду 0 дБ. И хотя в исходном файле клиппинга нет, то, поскольку компрессия файла в МР3 включает в себя и фильтрацию, и аппроксимацию более простым сигналом, то в итоге уровни сигнала также меняются. И за счет этого пиковые уровни могут повыситься. Когда такой файл декодируется, происходит клиппирование, которого в исходном файле не было.

Первый совет, который в таком случае можно дать - пользоваться декомпрессором, который позволяет записать в формат с плавающей запятой, чтобы клиппирование за счет компрессии не возникало. В программах, использующих QuickTime, то есть на компьютерах Mac и многих РС декомпрессия производится из МР3 в формат с плавающей запятой, и все пики, которые при этом восстановились, оказываются сохраненными в файле и находятся выше 0 дБ. Если такой файл проиграть, он будет клиппировать, но его можно ограничить лимитером или просто уменьшить уровень, чтобы форма этих пиков была сохранена. Это самое первое и важное, что приходит в голову.

Но дальше все, к сожалению, значительно трудней. Я не знаю ни одного хорошего алгоритма для восстановления качества записей, которые были скомпрессированы в МР3, АС3, ААС или какой-либо другой формат с потерями. Есть некоторые программные средства, о которых заявлено, что они являются восстановителями качества МР3-файлов, но в реальности там применяются операции, которые не реставрируют сигнал, а являются неким "творческим" улучшением звука. Например, Transient Shaper, то есть формирователь переходных компонентов сигнала. Подчеркивание транзиентов некоторым образом повышает четкость атак и ударных инструментов в фонограмме, но называть такую операцию восстановлением от артефактов в МР3 вряд ли можно.

Есть также эксайтеры, которые пытаются синтезировать высокие частоты, потерянные при кодировании в МР3, но они могут вносить искажения и ниже частоты среза. Поскольку у эксайтера нет информации о том, какие эти верхние частоты были на самом деле, он пытается восстановить их так, как предполагает и считает нужным, и это не обязательно приближает нас к оригиналу. Хотя это может выглядеть как некоторое улучшение звучания.

Поэтому, повторюсь, лучше всего воспользоваться декомпрессором, который позволяет декодировать без клиппирования файл, ограниченный в оригинале под 0 дБ, а дальше уже - по ситуации. Есть информация, что в iTunes записи нормализуются под -1 дБ, чтобы при воспроизведении избежать клиппирования. Вообще качество алгоритмов и работы конкретных программ-кодеров МР3 исключительно важно, они сильно различаются по качеству звука при одинаковых параметрах битрейта и разрядности.

Потому и известно общее правило - при реставрации дела с компрессированными файлами по возможности не иметь.

Полностью согласен - при наличии некомпрессированного файла предпочтение следует отдавать ему.

Но есть огромный массив материала, связанный с аудиовизуальной продукцией - всякие сетевые ролики, клипы с YouTube и т.п., где с саундтреком, увы, происходят непредсказуемые вещи, и в итоге звук может очень сильно измениться по характеру сигнала.

Да, это отдельная большая тема. Я сам не исследовал специально этот вопрос, но я знаю, что действительно применяется сильная компрессия как для видео, так и для аудио, причем характер компрессии аудио может зависеть от того, какая компрессия выбрана пользователем для видео. Например, если выбрано видео HD, то и аудио будет передаваться более качественное, а если выбрано SD 360, то и аудио будет с низким битрейтом. Видимо, на серверах хранятся варианты высокого и низкого качества. Тут уже больше вопрос к программистам YouTube - может ли пользователь влиять на то, как сервис будет обрабатывать вашу дорожку. Может быть, вскоре там будет применяться автоматическая компрессия, шумоподавление или нормализация. Понятно, что для пользователя, который никогда со звуком не работал, всякая автоматизация может казаться благом, но для звукорежиссеров и создателей профессионального медиа-контента это, конечно, большая проблема - не знать, что происходит с твоей записью на сервере.

Сейчас внедряются новые методы измерения аудиосигналов. В третьей версии RX появилось окно статистики, где, помимо привычного RMS , указываются такие параметры, как True Pick Level , Sample Peak Level , LU и LUFS . Несколько слов о том, как "читать " эти показатели?

  • Peak Level - это максимальный уровень цифровых отсчетов, тот пиковый уровень, который покажет большинство рабочих станций, а True Pick Level - это уровень аналогового сигнала, который будет восстановлен ЦАП по цифровым отсчетам. Поскольку ЦАП включает в себя фильтр передискретизации, он генерирует не ступеньки и не отрезки прямой между семплами, а плавную кривую, которая, осциллируя между цифровыми отсчетами, может в том числе и превышать их по уровню. Поэтому пиковый уровень аналогового сигнала, восстановленный по цифровым отсчетам, также следует контролировать, для чего отображается истинно-пиковый уровень. Он чаще всего оказывается несколько выше, порой до децибела, чем цифровой пиковый уровень. Величина превышения зависит от обилия высоких частот и резких сильных транзиентов в сигнале.
  • - это измерения громкости сигнала согласно современным стандартам IEC 1770 и др. В отличие от объективного измерения сигнала по электрическому уровню, измерение по громкости приближено к слуховому восприятию и особенностям слуха. Это измерение по специальной кривой, учитывающей кривые равной громкости, измерение с учетом особенностей интеграции по времени: длинное, короткое (соответствующе показаниям VU), и общее для всей фонограммы или выделенного фрагмента. Эти показатели лучше учитывают тональный баланс и характер звучания, чем чисто физический показатель давления RMS. Особенно важно, что вычисляется величина динамического диапазона - насколько фонограмма "сплющена". Все это позволяет проверить фонограмму на соответствие стандартам, которые сейчас внедряются в вещании.

Выше мы затронули вопросы творческого подхода к реставрации, улучшения - мне тоже приходилось на одной старой зашумленной фонограмме прорисовывать вручную удары по тарелке и хайхэту, при этом тоже вручную выделять отрезки между ударами и вносить в них некоторое затухание, и тогда удары становились более "читаемыми ", яркими и отчетливыми. Но это чрезвычайно трудоемкая работа! Порой на одну секунду звучания уходит несколько минут работы! Можно ли ее как-то автоматизировать?

Я не уверен, что операция, которую вы делали, универсальна и подойдет для всех, она применима при определенных видах звучания определенных инструментов. Пока ее трудно автоматизировать, потребуется много настроек, и результат может оказаться хуже, чем при ручной редакции.

Насколько реставрация - чисто техническая, инженерная работа и насколько творческая? Каковы рамки того, что может позволить себе реставратор и чего он не должен себе позволять?

Это очень субъективный вопрос. Все зависит от слушателей. Есть люди, которые будут недовольны любым вмешательством в запись, даже самым минимальным подавлением шумов и щелчков. Но большинство слушателей придерживается некоей середины. Они готовы принять значительное подавление шумов, конечно, если при этом не страдает тембр. Они будут рады преобразованию моно в стерео. Я считаю, это вполне допустимо и соответствует духу времени.

Слово "реставрация " означает восстановление. Вправе ли мы добиваться воссоздания утраченных информационных элементов звучания с помощью таких методов, как эксайтер и т.п.?

Думаю, это должен решать каждый звукорежиссер. Сам я, если меня просят, ограничиваюсь устранением дефектов и шумов, а затем передаю материал звукорежиссеру, и он решает, что делать дальше. Я считаю, что все допустимо, но надо быть честным со слушателем. Надо писать на обложках альбомов, что сделано - творческая реставрация или минимальное шумоподавление. В этом случае пуристы купят один ремастеринг, а обычные слушатели, которые не знают, как звучал нетронутый оригинал - другой.

Я считаю, что реставратор вправе "помочь " исполнителю преодолеть недостатки старой записывающей техники. Мастера прошлого не виноваты, что порой в их записях не слышно половину звуков или микрофон изменил тембр голоса. В третьей версии RX появился полезный инструмент, позволяющий выделить первые десять гармоник, и можно приподнять, скажем, верхнюю певческую форманту и вернуть голосу певца яркость, утраченную при записи. Понятно, что это уже совсем не инженерное решение.

Да, эквализация - это уже часть реставрации, ее творческая часть. Такие вещи требуют хороших музыкальных знаний от реставратора, знания теории и гармонии, знания истории музыки и стилей.

И спасибо вашей компании и ее разработчикам, что они дали в руки реставраторов такие мощные и глубокие инструменты реставрации, а не только возможность щелчки убирать. Я думаю, что развитие такого инструментария, такого функционала в будущем даст невероятные возможности восстановления утраченного звука, и вам следует и далее двигаться в этом направлении.

Да, мы над этим работаем, и в научном сообществе такие направления и результаты появляются, и наша задача в iZotope заключается в том, чтобы свести вместе научные исследования и практические разработки, чтобы дать реставраторам как можно больше возможностей для работы.

Спасибо вам за ваш труд, и будем ждать новинок!

Анатолий Вейценфельд

Реставрация аудио-записей в домашних условиях Есть материалы, которые необходимы читателю как воздух. Если честно, то письма с вопросами на эту тему у меня исчисляются десятками, а общая сумма уже перевалила за сотню. Ну что ж, давайте разбираться...

Если честно, то звук, записанный с некачественного источника, практически не восстановим до своего первоначального качественного уровня. Его можно обработать шумодавами, добавить/возбудить пару гармоник, но по мере этих действий мы все дальше уходим от оригинала. То есть, заниматься будем тем, чем иногда занимаются женщины бальзаковского возраста, чтобы быть прекрасней - наносить косметику и скрывать огрехи. И иногда, согласитесь, у них это получается просто превосходно. Итак, давайте рассмотрим источники, которыми пользуются читатели. Основных три: магнитофон, телевизор и проигрыватели LP-дисков. Потери в качестве записи с таких источников очевидны. Но к каждому методу требуется свой подход.

Магнитофон: шумы, фон, гармонические искажения, интермодуляционные искажения, специфическая спектрограмма воспроизводящего аудиотракта.

Телевизор: в ряде случаев "дребезжание" звука (исправляется компрессором), шумы, проблемы из-за конвертации современных произведений из моно в стерео, искажения картины из-за использования в некоторых современных моделях задержки между двумя каналами для создания объемных эффектов, специфическая спектрограмма воспроизводящего аудиотракта.

LP-проигрыватели. Треск, щелчки, шум, срез некоторых полос частот. Если имеем дело со старыми винилами от фирмы "Мелодия", то в ряде случаев частотный диапазон очень узок, но сие обеспечивает максимальную прослушиваемость. Давайте условимся, что мы не будем говорить о высокотехнологичных представителях устройств высшего класса. Мы говорим об обычных аудиосистемах.

Шумы

Практически все рассматриваемые нами устройства имеют недостаток - шум. Это самый серьезный пункт работы с реставрацией. Шум - это звук, складывающийся из множества различных гармоник (обертонов), и в ряде случаев распространяющийся на весь частотный диапазон. Практически я встретил единственный алгоритм качественной обработки частотных полос - при кодировании в МР3. Не будем затрагивать сами алгоритмы, но хочется отметить, что любой файл, закодированный в МР3, обладает большей "контурностью" звука. Я помню, когда проводил опыт со множеством кодирований/декодирований одного и того же файла. Как помню, за сам файл взял вокальный трек Suzanne Vega. Результатом исследований стал файл шепота, получившийся из вокала. Помимо этого, сгенерировались какие-то дополнительные шумы, которые с определенного момента стали заметны. Поэтому кодирование в МР3 надо использовать очень аккуратно. Оно может подойти или не подойти к каждому отдельно взятому случаю.

Эффективным методом считалось ранее использование Компрессор/Гейт/Лимитер. Лично я не считаю это использование верным, поскольку практически вся информация, которая нам доступна с вышеназванных устройств, уже прошла обработку данной связкой при мастеринге или премастеринге. В данном случае мы просто "убиваем" некоторые гармоники, что не есть выход из положения.

Самым продвинутым решением стало создание образца шума и накладывания его в противофазе с исходным файлом. Именно такой метод и стал популярным, поскольку в ряде случаев абсолютно безвреден для полезного сигнала. Его реализацию мы можем наблюдать в Cool Edit и Sonic Foundry Sound Forge.

Образцы шума можно создавать и самостоятельно. Например, если мы имеем дело с записью с кассеты, то нас интересует фрагмент "тишины" между песнями. Записав данный фрагмент, мы подвергаем его следующей обработке: выделяем некую циклическую часть, смотря на изображение волны. После этого обрезаем ее в самом начале и конце в точке пересечения синусоиды с нулем. Потом для данного фрагмента применяем операцию "Invert" (существует практически во всех звуковых редакторах). И все, образец шума в противофазе создан. После этого в программе уровня AudioMulch запускаем подготовленный сэмпл в режиме циклического воспроизведения. Параллельно включаем кассету и регулируем задержку на образец. При нормальном совпадении значительная часть шумов должна исчезнуть. Многие спросят: зачем такая громоздкая схема? Отвечу: представьте, что Вам надо записать 90 минут материала. Если каждый файл, записав, обрабатывать в Cool Edit, то эти 90 минут материала выльются в несколько дней работы. Самое главное в данном способе не трогать регуляторы уровней воспроизведения и записи, поскольку все пойдет прахом.

Шумы квантования

Одним из источников шума и искажений нужно рассматривать записывающий аудио-тракт, то бишь Вашу саундкарту. Чтобы обеспечить минимальные потери с этой стороны, нужно правильно выставить уровень записи. Максимумы амплитуды должны находиться на максимально возможном уровне, но "срезы" данных максимумов - исключены. Если уровень записи мал, то шумы квантования будут в большей степени присутствовать в сигнале. Для удаления шумов квантования предусмотрена операция dithering - генерация и добавление шума, исключающего шумы квантования.

Интермодуляционные искажения

Этот вид искажений специфичен для аналоговых ленточных магнитофонов. При воспроизведении аудио скорость пленки претерпевает кратковременные изменения (в устройстве не предусмотрено ни одно устройство, отвечающее за синхронизацию). В результате частотный спектр немного размывается, так как известно, что при замедлении звук становится ниже, при убыстрении - выше. Самый положительный способ - кодирование/декодирование MP3 -> WAV. Запись приобретет более "цифровое" звучание.

Удаление щелчков и кликов

Сколько я ни встретил в своей жизни программных модулей DeClicker, результатом их действия доволен не был. В большинстве случаев страдает частотный диапазон. Мне даже жизнь в одно время приподнесла очень хороший урок: материал альбома одной группы был записан с ADAT в Lexicon, но были очевидны проблемы с синхронизацией и имели место щелчки. Причем сплошь и рядом. Качество записанного материала также обладало не лучшими характеристиками. Я понял, что, используя DeClicker"ы, качество выходного материала, соответствующее моим представлениям о качестве, я не получу. Пришлось делать обработку вручную. И знаете, я получил неожиданный результат. Что я делал?

В Sound Forge при максимальном Zoom (масштабе изображения волны) с помощью операций Normalize, Fade In, Fade Out я обработал каждый щелчок. Для общей картины эти кратковременные "пропадания" были не заметны, но щелчки исчезли.

Если Вы хотите работать на высоком уровне с реставрацией аудиозаписей, то фонящих устройств желательно избегать. Используйте приставки, а не комплексы. Примите за факт, что любой модуль, стоящий на пути от носителя до АЦП, накладывает свои "добавления" к полезному сигналу. Я долгое время проработал с гитарным звуком, чтобы знать, как иногда бесполезно бороться с фоном от "наводок" и дешевых примочек. Для удаления фона можно пользоваться генераторами тона, подключая сформированный ими сигнал в противофазу с исходным.

Многие алгоритмы уничтожения фона близки к уничтожению шума. То есть, тот же файл-образец, и та же противофаза.

В ряде случаев гул на низких частотах просто убирается эквалайзером.

Улучшение качественных характеристик звучания

Придумано на самом деле немного.

1. Энхансеры.

2. Сурраунд.

3. Возбуждение гармоник и добавление искажений.

4. Генерация дополнительных гармоник и сложение их с исходным сигналом.

5. Система MaxxBass или подобная ей.

6. Hi Cutoff и Hi Boost.

8. Компрессия.

Как все это работает, можно пронаблюдать в программах DFX (WinAmp plug-in), Ray Gun, Restoration-NR, T-RackS и т.п.

Что должно находиться на рабочем столе "реставратора"?

Dart Pro 32; Cool Edit Pro 1.2

Arboretum Systems Restoration-NR

Arboretum Systems Ray Gun

Blade MP3 Enc (или любой другой кодер)

T-RackS; AudioMulch 0.9 b4

PAS Analysis&EQ 2.0

Выводы

Технологический уровень в музыкальном производстве растет день ото дня. Поэтому реставрация записей - это сфера специалистов высокой квалификации и студий дорогого оснащения. На самом деле, чтобы сделать из продукта "куколку", требуется прежде всего опыт. Поэтому я в данном материале показал, как решаю эти проблемы, но не факт, что это законченные решения в данной области. Главное, что хочется сказать, - решение этой проблемы никогда не приблизится к идеалу. Идеально чистый звук - это звук GM-синтезатора, но не факт, что он любим слушателями. Поэтому, работая над реставрацией, Вы должны добиться просто чистоты и прозрачности, которые так присущи современным продуктам музыкальной индустрии. Кристофер М. ИХИХО

Глава 3 Реставрация старых записей

Качественные компьютерные системы шумопонижения сделали возможным появление множества программ для реставрации старых звукозаписей. Система реставрации – это не только шумопонижение. Это целый комплекс взаимодополняющих функций, таких, например, как декликер (удаление щелчков), система распознавания и удаления характерного шипения грампластинки и др. Одна из самых трудных задач при реставрации звукозаписей – устранение нелинейных искажений.

Как известно, архивные записи, хранящиеся на магнитофонных лентах и виниловых пластинках, со временем теряют первоначальное качество звучания. На них появляются различные шумы и помехи, мешающие нормальному прослушиванию и портящие общее впечатление от записи. Наиболее часто встречающиеся дефекты – это импульсные помехи (щелчки) и фоновые шумы (шипение магнитофонной ленты, шум при воспроизведении с винилового диска), вызываемые плохими условиями хранения или недостаточно хорошим качеством первоначальной записи.

С возрастанием мощности современных компьютеров и появлением более сложных алгоритмов обработки звуковых сигналов открылась возможность восстанавливать архивные фонограммы путем сложной вычислительной обработки исходного сигнала при помощи компьютера. Такой способ восстановления звука обладает чрезвычайно высокой эффективностью и гибкостью, позволяет устранять помехи, щелчки, фоновый шум и другие дефекты записи. Без сомнения, это одно из важнейших достижений в области компьютерной обработки звука. Главное достоинство данного метода состоит в том, что в отличие от обычных систем шумопонижения, действующих по принципу фильтрации частот, компьютерная реставрация, по мнению разработчиков программ, не оказывает практически никакого отрицательного влияния на основной сигнал (это утверждение, однако, оспаривается многими экспертами и любителями музыки).

Средства удаления шумов с фонограмм включаются в профессиональные редакторы звука обычно в виде дополнительных программных модулей. Кроме того, разработаны программы, предназначенные специально для восстановления аудиозаписей. Одной из них является выпускаемая фирмой ZH Computer, Inc. программа DART Pro 32, которая содержит полный набор средств, позволяющих качественно удалить с записи импульсные помехи и фоновые шумы. Кроме того, с ее помощью пользователь может редактировать восстановленную фонограмму. Таким образом, DART Pro 32 позволяет достичь отличных результатов при реставрации любых фонограмм.

Для аудиоредактора Sound Forge фирма Sonic Foundry выпускает дополнительный модуль Noise Reduction, удаляющий шипение магнитной ленты, помехи, вызванные электромагнитными наводками электросетей, и прочие шумы.

В программе WaveLab для реставрации используются два дополнительных модуля – DeNoiser и DeClicker.

Кроме того, в базовый комплект поставки WaveLab входит модуль эффектов Grungelizer, который выполняет функции, прямо противоположные описанным выше. Он используется для имитации старых «зашумленных» записей путем добавления в исходный сигнал таких специфических помех, как фон, создаваемый наводками переменного напряжения, щелчки и треск, характерные для виниловых звуконосителей, высокочастотное шипение, которое наблюдается при воспроизведении звука с помощью аналогового магнитофона. В дополнение ко всему перечисленному с помощью рассматриваемого модуля можно сужать частотный диапазон сигнала и имитировать перегрузку усилителя.

Из книги Давайте создадим компилятор! автора Креншоу Джек

Из книги Запись CD и DVD: профессиональный подход автора Бахур Виктор

Реставрация записи Программа Adobe Audition 1.5 имеет большое количество инструментов, позволяющих восстановить звук, записанный на компьютер с виниловых пластинок, кассетных и бобинных магнитофонов, а также удалить шипение, щелчки, перегрузку и другие нежелательные

Из книги Windows Vista без напряга автора Жвалевский Андрей Валентинович

Совместимость старых программ с Windows Vista Большинство программ, созданных для предыдущих версий Windows, успешно работают и в Windows Vista, но в работе некоторых приложений обнаруживаются сбои или же полный отказ от запуска. Все из-за того, что система отказывается запускать

Из книги Windows Vista автора Вавилов Сергей

Совместимость старых программ с Windows Vista Большинство программ, созданных для предыдущих версий Windows, успешно функционируют и в Windows Vista, однако в работе некоторых из них обнаруживаются сбои. Иногда встречается полный отказ от запуска из-за несовместимости приложения с

Из книги Обработка баз данных на Visual Basic®.NET автора Мак-Манус Джеффри П

Из книги UNIX: взаимодействие процессов автора Стивенс Уильям Ричард

ГЛАВА 9 Блокирование записей

Из книги Scrum и XP: заметки с передовой автора Книберг Хенрик

Подход №2: «Начинать реализовывать новые истории, но наивысшим приоритетом ставить доведение старых до ума» Мы предпочитаем этот подход. По крайней мере, до сих пор так и было.По сути, он состоит в следующем: когда мы заканчиваем спринт, мы переходим к следующему, но

Из книги Тайм-менеджмент для системных администраторов автора Лимончелли Томас

Удаление старых процедур Иногда приходится обновлять процедуры.В истории с заправкой автомобиля, рассказанной ранее в этой главе, я отметил, что в какой-то момент забыл, с чего началась эта процедура, но продолжал выполнять ее. Это вызывает некоторую тревогу. Правильно ли

Из книги Настройка Windows 7 своими руками. Как сделать, чтобы работать было легко и удобно автора Гладкий Алексей Анатольевич

Глава 5 Настройка и использование учетных записей пользователей В операционной системе Windows 7 учетная запись пользователя – это набор сведений, определяющих, к каким папкам и файлам пользователь имеет доступ, и какие изменения могут вноситься пользователем в работу

Из книги Разработка приложений в среде Linux. Второе издание автора Джонсон Майкл К.

25.4.1. Добавление записей Новые и обновленные записи заносятся в базу данных с использованием функции dpput().int dpput(DEPOT * dfepot, const char * key, int keySize, const char * data, int dataSize, int dmode);key представляет собой значение индекса, который впоследствии может использоваться для получения информации,

Из книги Linux: Полное руководство автора Колисниченко Денис Николаевич

25.4.2. Удаление записей Удаление записей из базы данных осуществляется путем вызова функции dpout() и передачи ей ключа, данные которого необходимо удалить.int dpout(DEPOT * depot, const char * key, int keySize);Заданный ключ и связанные с ним данные удаляются из базы, после чего возвращается

Из книги Linux и UNIX: программирование в shell. Руководство разработчика. автора Тейнсли Дэвид

6.2.5. Настройка сети в старых дистрибутивах Если вам недоступны графические конфигураторы, то можно настроить сетевой интерфейс и из командной строки.Добавьте в файл установленного оборудования (скорее всего, он будет называться /etc/conf.modules) сведения о своей сетевой

Из книги Как заработать в Интернете. 35 самых быстрых способов автора Фомина Ольга

Из книги Установка, настройка и восстановление Windows 7 на 100% автора Ватаманюк Александр Иванович

1. Заработать на старых вещах: сайты аукционы в сети, как заработать на них Интернет-аукцион (он же «онлайновый аукцион») – это торги, происходящие через сеть интернет. Отличаются от обыкновенных аукционов, тем, что проводятся на отдалении (на расстоянии) и в них можно

Из книги Цифровая фотография. Трюки и эффекты автора Гурский Юрий Анатольевич

Глава 11 Настройка контроля учетных записей пользователей С механизмом контроля учетных записей пользователей уже успели познакомиться те, кто работал в Windows Vista. Как и в Vista, в Windows 7 данный механизм призван защитить операционную систему от запуска разнообразных

Из книги автора

17.12. Окрашивание старых фотографий людей Большинство старых фотографий выполнено в монохромном цвете. Это придает снимку шарм и подчеркивает его почтенный возраст. С другой стороны, при взгляде на такую фотографию возникает ощущение, что часть информации была утеряна

МИНИСТЕРСТВО ОБРАЗОВАНИЯ

РОССИЙСКОЙ ФЕДЕРАЦИИ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ

РАДИОТЕХНИКИ ЭЛЕКТРОНИКИ И АВТОМАТИКИ

(ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

Курсовая работа по информатике

Старая пластинка: Что такое цифровой звук и реставрация звука с помощью цифровой обработки.

Студент Чистяков И.А.

Группа ОТО 4-04

Преподователь Андрианова Е. Г.

Работа допущена к защите_____________________________

Курсовая работа защищена с оценкой ___________________

Москва 2005

1.Введение………………………………………………………………..3

2. Часть первая, теоретическая……..………………………………..3

А. Теория цифрового звука……………………………….……3

Б. Оцифровка звука и его хранение на цифровом носителе.7

Г. Преимущества и недостатки цифрового звука………….14

Д. К вопросу об обработке звука……………..……………….17

Е. Аппаратура………………………………………..…………18

Ж. Программное обеспечение………………………….……..22

3.Часть вторая: больше практическая……………..…………………25

1. Подключение проигрывателя к компьютеру…..……….25

2. Настройка возможностей звуковой карты……..………..26

3. Реставрация……………………………………….…………26

4. Подготовка файлов…………………………………………32

5. Разделение файла wave на отдельные композиции........32

6. Перспективы и проблематика……………………………33

7. Глоссарий терминов……………………………………….34

1.Введение

В последнее время возможности мультимедийного оборудования претерпели значительный рост, и этой области уделяется достаточное количество внимания, но все же рядовой пользователь никак не может составить себе четкого представления о том, какие возможности скрывает его железный друг в области воспроизведения звука, писка, шумов, бинаруальных волн и т.д. Все ограничивается воспроизведением криков и взрывов в играх и фильмах (благо технический прогресс докатился уже до такого уровня) и прослушивания домашней фонотеки (или уже пора придумать другое название, что-нибудь типа «цифротеки»?).

Попробуем в данном труде разобраться в основных аспектах данной проблемы. Поговорим немного об анатомии, теории цифрового звука и что можно извлечь из старой виниловой пластинки и аудиокассеты.

Что именно мы знаем о звуковых возможностях компьютера, кроме того, что в нашем домашнем компьютере установлена звуковая плата и две колонки? К сожалению, вероятно из-за недостаточности литературы или по каким-либо другим причинам, но пользователь, чаще всего, не знаком ни с чем, кроме встроенного в Windows микшера аудио входов/выходов и Recorder^а. Для того чтобы узнать что же умеет компьютер в области звука, нужно только поинтересоваться и перед вами откроются возможности, о которых вы, может быть, даже не догадывались. И все это не так сложно, как может показаться на первый взгляд.

2.Часть первая: больше теоретическая.

Все процессы записи, обработки и воспроизведения звука так или иначе работают на один орган, которым мы воспринимаем звуки - ухо. Две штуки:).
Без понимания того, что мы слышим, что нам важно, а что нет, в чем причина тех или иных музыкальных закономерностей - без этих и других мелочей невозможно спроектировать хорошую аудио аппаратуру, нельзя эффективно сжать или обработать звук. То, что здесь описано - лишь самые основы.
Снаружи мы видим так называемое внешнее ухо. Ничего особенного нас тут не интересует. Затем идет канал - примерно 0.5 см в диаметре и около 3 см в длину. Далее - барабанная перепонка, к которой присоединены кости - среднее ухо. Эти косточки передают вибрацию барабанной перепонки далее - на другую перепонку, во внутреннее ухо - трубку с жидкостью, около 0.2 мм диаметром и еще целых 3-4 см длинной, закрученная как улитка. Смысл наличия среднего уха в том, что колебания воздуха слишком слабы, чтобы напрямую колебать жидкость, и среднее ухо вместе с барабанной перепонкой и перепонкой внутреннего уха составляют гидравлический усилитель - площадь барабанной перепонки во много раз больше перепонки внутреннего уха, поэтому давление
(которое равно F/S) усиливается в десятки раз.
Во внутреннем ухе по всей его длине натянута некая штука, напоминающая струну - еще одна вытянутая мембрана, жесткая к началу уха и мягкая к концу. Определенный участок этой мембраны колеблется в своём диапазоне, низкие частоты - в мягком участке ближе к концу, самые высокие - в самом начале. Вдоль этой мембраны расположены нервы, которые воспринимают колебания и передают их в мозг, используя два принципа:
Первый - ударный принцип. Поскольку нервы еще способны передавать колебания
(бинарные импульсы) с частотой до 400-450 Гц, именно этот принцип влоб используется в области низкочастотного слуха. Там сложно иначе - колебания мембраны слишком сильны и затрагивают слишком много нервов. Ударный принцип немного расширяется до примерно 4 кГц с помощью трюка - несколько (до десяти) нервов ударяют в разных фазах, складывая свою пропускную способность. Этот способ хорош тем, что мозг воспринимает информацию более полно - с одной стороны, мы всё таки имеем легкое частотное разделение, а с другой - можем еще смотреть сами колебания, их форму и особенности, а не просто частотный спектр. Этот принцип продлен на самую важную для нас часть
- спектр человеческого голоса. Да и вообще, до 4 кГц находится вся наиболее важная для нас информация.

Ну и второй принцип - просто местоположение возбуждаемого нерва, применяется для звуков более 4 кГц. Тут уже кроме факта нас вообще ничего не волнует - ни фаза, ни скважность.. Голый спектр.
Таким образом, в области высоких частот мы имеем чисто спектральный слух не очень высокого разрешения, а для частот близких к человеческому голосу - более полный, основанный не только на разделении спектра, а еще и на дополнительном анализе информации самим мозгом, давая более полную стерео - картину, например. Об этом - ниже.

Основное восприятие звука происходит в диапазоне 1 - 4 кГц, в этом же диапазоне заключено человеческий голос (да и звуки, издаваемые большинством важных нам процессов в природе). Корректная передача этого частотного отрезка - первое условие естественности звучания.

О чувствительности (по мощности и частотной)

Теперь о децибелах. Вкратце - аддитивная относительная логарифмическая мера громкости (мощности) звука, наиболее хорошо отражающая человеческое восприятие громкости, и в то же время достаточно просто вычисляемая.

В акустике принято измерять громкость в дБ SPL (Sound Power Level - не знаю как это звучит у нас). Ноль этой шкалы находится примерно на минимальном звуке, который слышит человек. Соответственно отсчет ведется в положительную сторону. Человек может осмысленно слышать звуки громкостью примерно до 120 дБ SPL. При 140 дБ ощущается сильная боль, при 150 дБ наступает повреждение ушей. Нормальный разговор - примерно 60 - 70 дБ SPL.
Далее в этом разделе при упоминании дБ подразумевается дБ от нуля по SPL.
Чувствительность уха к разным частотам очень сильно различна. Максимальна чувствительность в районе 1 - 4 кГц, основные тона человеческого голоса.
Звук 3 кГц - это и есть тот звук, который слышен при 0 дБ. Чувствительность сильно падает в обе стороны - например для звука в 100 Гц нам нужно уже целых 40 дБ (в 100 раз большая амплитуда колебаний), для 10 кГц - 20 дБ.
Обычно мы можем сказать, что два звука отличаются по громкости, при разнице примерно в 1 дБ. Несмотря на это, 1 дБ - это скорее много, чем мало. Просто у нас очень сильно компрессированное, выровненное восприятие громкости.
Зато весь диапазон - 120 дБ - воистину огромен, по амплитуде это миллионы раз!

Кстати, увеличение амплитуды в два раза соответствует увеличению громкости на 6 дБ. Внимание! не путайте: 12 дБ - в 4 раза, но разница 18 дБ - уже 8 раз! а не 6, как могло подуматься. дБ - логарифмическая мера)

Аналогична по свойствам и спектральная чувствительность. Мы можем сказать, что два звука (простых тона) отличаются по частоте, если разница между ними составляет около 0.3% в районе 3 кГц, а в районе 100 Гц требуется различие уже на 4%! Для справки - частоты нот (если брать вместе с полутонами, то есть две соседние клавиши фортепьяно, включая черные) отличаются на примерно 6%.
В общем, в районе 1 - 4 кГц чувствительность уха по всем параметрам максимальна, и составляет не так уж и много, если брать не логарифмированные значения, с которыми приходится работать цифровой технике. Примите на заметку - многое из того, что происходит в цифровой обработке звука, может выглядеть ужасно в цифрах, и при этом звучать неотличимо от оригинала.

В цифровой обработке понятие дБ считается от нуля и вниз, в область отрицательных значений. Ноль - максимальный уровень, представимый цифровой схемой.

А. Собственно говоря, о самой цифре.

Некоторые факты и понятия, без которых тяжело обойтись.

В соответствии с теорией математика Фурье, звуковую волну можно представить в виде спектра входящих в нее частот.

Частотные составляющие спектра - это синусоидальные колебания (так называемые чистые тона), каждое из которых имеет свою собственную амплитуду и частоту. Таким образом, любое, даже самое сложное по форме колебание
(например, человеческий голос), можно представить суммой простейших синусоидальных колебаний определенных частот и амплитуд. И наоборот, сгенерировав различные колебания и наложив их друг на друга (смикшировав, смешав), можно получить различные звуки.

Справочка: человеческий слуховой аппарат/мозг способен различать частотные составляющие звука в пределах от 20 Гц до ~20 КГц (верхняя граница может колебаться в зависимости от возраста и других факторов).
Кроме того, нижняя граница сильно колеблется в зависимости от интенсивности звучания.

Б. Оцифровка звука и его хранение на цифровом носителе

«Обычный» аналоговый звук представляется в аналоговой аппаратуре непрерывным электрическим сигналом. Компьютер оперирует с данными в цифровом виде. Это означает, что и звук в компьютере представляется в цифровом виде. Как же происходит преобразование аналогового сигнала в цифровой?

Цифровой звук – это способ представления электрического сигнала посредством дискретных численных значений его амплитуды. Допустим, мы имеем аналоговую звуковую дорожку хорошего качества (говоря «хорошее качество» будем предполагать нешумную запись, содержащую спектральные составляющие из всего слышимого диапазона частот – приблизительно от 20 Гц до 20 КГц) и хотим «ввести» ее в компьютер (то есть оцифровать) без потери качества. Как этого добиться и как происходит оцифровка? Звуковая волна – это некая сложная функция, зависимость амплитуды звуковой волны от времени. Казалось бы, что раз это функция, то можно записать ее в компьютер «как есть», то есть описать математический вид функции и сохранить в памяти компьютера.
Однако практически это невозможно, поскольку звуковые колебания нельзя представить аналитической формулой (как y=COSx, например). Остается один путь – описать функцию путем хранения ее дискретных значений в определенных точках. Иными словами, в каждой точке времени можно измерить значение амплитуды сигнала и записать в виде чисел. Однако и в этом методе есть свои недостатки, так как значения амплитуды сигнала мы не можем записывать с бесконечной точностью, и вынуждены их округлять. Говоря иначе, мы будем приближать эту функцию по двум координатным осям – амплитудной и временной
(приближать в точках – значит, говоря простым языком, брать значения функции в точках и записывать их с конечной точностью). Таким образом, оцифровка сигнала включает в себя два процесса - процесс дискретизации
(осуществление выборки) и процесс квантования. Процесс дискретизации - это процесс получения значений величин преобразуемого сигнала в определенные промежутки времени (рис. 1).

Квантование - процесс замены реальных значений сигнала приближенными с определенной точностью (рис. 2). Таким образом, оцифровка – это фиксация амплитуды сигнала через определенные промежутки времени и регистрация полученных значений амплитуды в виде округленных цифровых значений (так как значения амплитуды являются величиной непрерывной, нет возможности конечным числом записать точное значение амплитуды сигнала, именно поэтому прибегают к округлению). Записанные значения амплитуды сигнала называются отсчетами.
Очевидно, что чем чаще мы будем делать замеры амплитуды (чем выше частота дискретизации) и чем меньше мы будем округлять полученные значения (чем больше уровней квантования), тем более точное представление сигнала в цифровой форме мы получим.

Оцифрованный сигнал в виде набора последовательных значений амплитуды можно сохранить.

Теперь о практических проблемах. Во-первых, надо иметь в виду, что память компьютера не бесконечна, так что каждый раз при оцифровке необходимо находить какой-то компромисс между качеством (напрямую зависящим от использованных при оцифровке параметров) и занимаемым оцифрованным сигналом объемом.

Во-вторых, частота дискретизации устанавливает верхнюю границу частот оцифрованного сигнала, а именно, максимальная частота спектральных составляющих равна половине частоты дискретизации сигнала. Попросту говоря, чтобы получить полную информацию о звуке в частотной полосе до 22050 Гц, необходима дискретизация с частотой не менее 44.1 КГц.

Существуют и другие проблемы и нюансы, связанные с оцифровкой звука.
Не сильно углубляясь в подробности отметим, что в «цифровом звуке» из-за дискретности информации об амплитуде оригинального сигнала появляются различные шумы и искажения (под фразой «в цифровом звуке есть такие-то частоты и шумы» подразумевается, что когда этот звук будет преобразован обратно из цифрового вида в аналоговый, то в его звучании будут присутствовать упомянутые частоты и шумы). Так, например, джиттер (jitter)
– шум, появляющийся в результате того, что осуществление выборки сигнала при дискретизации происходит не через абсолютно равные промежутки времени, а с какими-то отклонениями. То есть, если, скажем, дискретизация проводится с частотой 44.1 КГц, то отсчеты берутся не точно каждые 1/44100 секунды, а то немного раньше, то немного позднее. А так как входной сигнал постоянно меняется, то такая ошибка приводит к «захвату» не совсем верного уровня сигнала. В результате во время проигрывания оцифрованного сигнала может ощущаться некоторое дрожание и искажения. Появление джиттера является результатом не абсолютной стабильности аналогово-цифровых преобразователей.
Для борьбы с этим явлением применяют высокостабильные тактовые генераторы.
Еще одной неприятностью является шум дробления. Как мы говорили, при квантовании амплитуды сигнала происходит ее округление до ближайшего уровня. Такая погрешность вызывает ощущение «грязного» звучания.

Справочка: стандартные параметры записи аудио компакт-дисков следующие: частота дискретизации - 44.1 КГц, уровень квантования – 16 бит.
Такие параметры соответствуют 65536 (2) уровням квантования амплитуды при взятии ее значений 44100 раз в секунду.

На практике, процесс оцифровки (дискретизация и квантование сигнала) остается невидимым для пользователя - всю черновую работу делают разнообразные программы, которые дают соответствующие команды драйверу
(управляющая подпрограмма операционной системы) звуковой карты. Любая программа (будь то встроенный в Windows Recorder или мощный звуковой редактор), способная осуществлять запись аналогового сигнала в компьютер, так или иначе оцифровывает сигнал с определенными параметрами, которые могут оказаться важными в последующей работе с записанным звуком, и именно по этой причине важно понять как происходит процесс оцифровки и какие факторы влияют на ее результаты.

Мы же его должны услышать, а цифорки нам слышать не дано.

2. Преобразование звука из цифрового вида в аналоговый

Как после оцифровки прослушивать звук? То есть, как преобразовывать его обратно из цифрового вида в аналоговый?

Для преобразования дискретизованного сигнала в аналоговый вид, пригодный для обработки аналоговыми устройствами (усилителями и фильтрами) и последующего воспроизведения через акустические системы, служит цифроаналоговый преобразователь (ЦАП). Процесс преобразования представляет собой обратный процесс дискретизации: имея информацию о величине отсчетов
(амплитуды сигнала) и беря определенное количество отсчетов в единицу времени, путем интерполирования происходит восстановление исходного сигнала
(рис. 3).

Еще совсем недавно воспроизведение звука в домашних компьютерах было проблемой, так как компьютеры не оснащались специальными ЦАП. Сначала в качестве простейшего звукового устройства в компьютере использовался встроенный динамик (PC speaker). Вообще говоря, этот динамик до сих пор имеется почти во всех PC, но никто уже не помнит как его «раскачать», чтобы он заиграл. Если вкратце, то этот динамик присоединен к порту на материнской плате, у которого есть два положения – 1 и 0. Так вот, если этот порт быстро-быстро включать и выключать, то из динамика можно извлечь более-менее правдоподобные звуки. Воспроизведение различных частот достигается за счет того, что диффузор динамика обладает конечной реакцией и не способен мгновенно перескакивать с места на место, таким образом он
«плавно раскачивается» вследствие скачкообразного изменения напряжения на нем. И если колебать его с разной скоростью, то можно получить колебания воздуха на разных частотах. Естественной альтернативой динамику стал так называемый Covox – это простейший ЦАП, выполненный на нескольких подобранных сопротивлениях (или готовой микросхеме), которые обеспечивают перевод цифрового представления сигнала в аналоговый – то есть в реальные значения амплитуды. Covox прост в изготовлении и поэтому он пользовался успехом у любителей вплоть до того времени, когда звуковая карта стала доступной всем.

В современном компьютере звук воспроизводится и записывается с помощью звуковой карты – подключаемой, либо встроенной в материнскую плату компьютера. Задача звуковой карты в компьютере – ввод и вывод аудио.
Практически это означает, что звуковая карта является тем преобразователем, который переводит аналоговый звук в цифровой и обратно. Если описывать упрощенно, то работа звуковой карты может быть пояснена следующим образом.
Предположим, что на вход звуковой карты подан аналоговый сигнал и карта включена (программно). Сначала входной аналоговый сигнал попадает в аналоговый микшер, который занимается смешением сигналов и регулировкой громкости и баланса. Микшер необходим, в частности, для предоставления возможности пользователю управлять уровнями. Затем отрегулированный и сбалансированный сигнал попадает в аналогово-цифровой преобразователь, где сигнал дискретизуется и квантуется, в результате чего в компьютер по шине данных направляется бит-поток, который и представляет собой оцифрованный аудио сигнал. Вывод аудио информации почти аналогичен вводу, только происходит в обратную сторону. Поток данных, направленный в звуковую карту, преодолевает цифро-аналоговый преобразователь, который образует из чисел, описывающих амплитуду сигнала, электрический сигнал; полученный аналоговый сигнал может быть пропущен через любые аналоговые тракты для дальнейших преобразований, в том числе и для воспроизведения. Надо отметить, что если звуковая карта оборудована интерфейсом для обмена цифровыми данными, то при работе с цифровым аудио никакие аналоговые блоки карты не задействуются.

Для хранения цифрового звука существует много различных способов. Как мы говорили, оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени. Таким образом, во- первых, блок оцифрованной аудио информации можно записать в файл «как есть», то есть последовательностью чисел (значений амплитуды). В этом случае существуют два способа хранения информации.

Первый (рис. 4) - PCM (Pulse Code Modulation - импульсно-кодовая модуляция) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд (бывают знаковое или беззнаковое представления). Именно в таком виде записаны данные на всех аудио CD.

Второй способ (рис. 5) - ADPCM (Adaptive Delta PCM - адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).

Во-вторых, можно сжать или упростить данные так, чтобы они занимали меньший объем памяти, нежели будучи записанными «как есть». Тут тоже имеются два пути.

Кодирование данных без потерь (lossless coding) - это способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К такому способу уплотнения данных прибегают в тех случаях, когда сохранение оригинального качества данных критично. Например, после сведения звука в студии звукозаписи, данные необходимо сохранить в архиве в оригинальном качестве для возможного последующего использования. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия. Подобные кодеры – это своего рода архиваторы данных (как ZIP, RAR и другие), только предназначенные для сжатия именно аудио.

Имеется и второй путь кодирования, на котором мы остановимся чуть подробнее, – кодирование данных с потерями (lossy coding). Цель такого кодирования - любыми способами добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем объеме упакованных данных. Это достигается путем использования различных алгоритмов «упрощающих» оригинальный сигнал (выкидывая из него «ненужные» слабослышимые детали), что приводит к тому, что декодированный сигнал фактически перестает быть идентичным оригиналу, а лишь похоже звучит. Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3),
MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA),
TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). Надо особо подчеркнуть, что в основе всех lossy-кодеров лежит использование так называемой психоакустической модели, которая как раз и занимается
«упрощением» оригинального сигнала. Говоря точнее, механизм подобных кодеров выполняет анализ кодируемого сигнала, в процессе которого определяются участки сигнала, в определенных частотных областях которых имеются неслышные человеческому уху нюансы (замаскированные или неслышимые частоты), после чего происходит их удаление из оригинального сигнала. Таким образом, степень сжатия оригинального сигнала зависит от степени его
«упрощения»; сильное сжатие достигается путем «агрессивного упрощения»
(когда кодер «считает» ненужными множественные нюансы), такое сжатие, естественно, приводит к сильной деградации качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания.

Как мы сказали, современных lossy-кодеров существует достаточно много.
Наиболее распространенный формат – MPEG-1 Layer III (всем известный MP3).
Формат завоевал свою популярность совершенно заслуженно – это был первый распространенный кодек подобного рода, который достиг столь высокого уровня компрессии при отличном качестве звучания. Сегодня этому кодеку имеется множество альтернатив, но выбор остается за пользователем. Преимущества
MP3 – широкая распространенность и достаточно высокое качество кодирования, которое объективно улучшается благодаря разработкам различных кодеров MP3 энтузиастами (например, кодер Lame). Мощная альтернатива MP3 – кодек
Microsoft Windows Media Audio (Файлы.WMA и.ASF). По различным тестам этот кодек показывает себя от «как MP3» до «заметно хуже MP3» на средних битрейтах, и, чаще, «лучше MP3» на низких битрейтах. Ogg Vorbis (файлы
.OGG) – совершенно свободный от лицензирования кодек, создаваемый независимыми разработчиками. Чаще всего ведет себя лучше MP3, недостатком является лишь малая распространенность, что может стать критическим аргументом при выборе кодека для длительного хранения аудио. Вспомним и еще молодой кодек MP3 Pro, анонсированный в июле 2001 года компанией Coding
Technologies совместно с Thomson Multimedia. Кодек является продолжением, или, точнее, развитием старого MP3 – он совместим с MP3 назад (полностью) и вперед (частично). За счет использования новой технологии SBR (Spectral
Band Replication), кодек ведет себя заметно лучше других форматов на низких битрейтах, однако качество кодирования на средних и высоких битрейтах чаще уступает качеству почти всех описанных кодеков. Таким образом, MP3 Pro пригоден больше для ведения аудио трансляций в Internet, а также для создания превью песен и музыки.

Говоря о способах хранения звука в цифровом виде нельзя не вспомнить и о носителях данных. Всем привычный аудио компакт-диск, появившийся в начале
80-х годов, широкое распространение получил именно в последние годы (что связано с сильным удешевлением носителя и приводов). А до этого носителями цифровых данных являлись кассеты с магнитной лентой, но не обычные, а специально предназначенные для так называемых DAT-магнитофонов. Ничего примечательного – магнитофоны как магнитофоны, однако цена на них всегда была высокой, и такое удовольствие было не всем «по зубам». Эти магнитофоны использовались, в основном, в студиях звукозаписи. Преимущество таких магнитофонов было в том, что, не смотря на использование привычных носителей, данные на них хранились в цифровом виде и практически никаких потерь при чтении/записи на них не было (что очень важно при студийной обработке и хранении звука). Сегодня появилось большое количество различных носителей данных, кроме привычных всем компакт дисков. Носители совершенствуются и с каждым годом становятся более доступными и компактными. Это открывает большие возможности в области создания мобильных аудио проигрывателей. Уже сегодня продается огромное количество различных моделей переносных цифровых плееров. И, можно предположить, что это еще далеко не пик развития такого рода техники.

Г. Преимущества и недостатки цифрового звука

С точки зрения обычного пользователя выгоды много - компактность современных носителей информации позволяет ему, например, перевести все диски и пластинки из своей коллекции в цифровое представление и сохранить на долгие годы на небольшом трехдюймовом винчестере или на десятке-другом компакт дисков; можно воспользоваться специальным программным обеспечением и хорошенько «почистить» старые записи с бобин и пластинок, удалив из их звучания шумы и треск; можно также не просто скорректировать звучание, но и приукрасить его, добавить сочности, объемности, восстановить частоты.
Помимо перечисленных манипуляций со звуком в домашних условиях, Интернет тоже приходит на помощь аудио-любителю. Например, сеть позволяет людям обмениваться музыкой, прослушивать сотни тысяч различных Интернет-радио станций, а также демонстрировать свое звуковое творчество публике, и для этого нужен всего лишь компьютер и Интернет. И, наконец, в последнее время появилась огромная масса различной портативной цифровой аудио аппаратуры, возможности даже самого среднего представителя которой зачастую позволяют с легкостью взять с собой в дорогу коллекцию музыки, равную по длительности звучания десяткам часов.

С точки зрения профессионала цифровой звук открывает поистине необъятные возможности. Если раньше звуковые и радио студии размещались на нескольких десятках квадратных метров, то теперь их может заменить хороший компьютер, который по возможностям превосходит десять таких студий вместе взятых, а по стоимости оказывается многократно дешевле одной. Это снимает многие финансовые барьеры и делает звукозапись более доступной и профессионалу и простому любителю. Современное программное обеспечение позволяет делать со звуком все что угодно. Раньше различные эффекты звучания достигались с помощью хитроумных приспособлений, которые не всегда являли собой верх технической мысли или же были просто устройствами кустарного изготовления. Сегодня, самые сложные и просто невообразимые раньше эффекты достигаются путем нажатия пары кнопок. Конечно, вышесказанное несколько утрировано и компьютер не заменяет человека – звукооператора, режиссера или монтажера, однако с уверенностью можно сказать, что компактность, мобильность, колоссальная мощность и обеспечиваемое качество современной цифровой техники, предназначенной для обработки звука, уже сегодня почти полностью вытеснило из студий старую аналоговую аппаратуру.

Впрочем, у цифрового представления данных есть одно неоспоримое и очень важное преимущество – при сохранном носителе данные на нем не искажаются с течением времени. Если магнитная лента со временем размагничивается и качество записи теряется, если пластинка царапается и к звучанию прибавляются щелчки и треск, то компакт-диск / винчестер / электронная память либо читается (в случае сохранности), либо нет, а эффект старения отсутствует. Важно отметить, мы не говорим здесь об Audio CD (CD-
DA – стандарт, устанавливающий параметры и формат записи на аудио компакт диски) так как не смотря на то, что это носитель цифровой информации, эффект старения его, все же, не минует. Это связано с особенностями хранения и считывания аудио данных с Audio CD. Информация на всех типах компакт-дисков хранится покадрово и каждый кадр имеет заголовок, по которому его возможно идентифицировать. Однако различные типы CD имеют различную структуру и используют различные методы маркировки кадров.
Поскольку компьютерные приводы CD-ROM рассчитаны на чтение в основном Data-
CD (надо сказать, что существуют различные разновидности стандарта Data-CD, каждый из которых дополняет основной стандарт CD-DA), они часто не способны правильно «ориентироваться» на Audio CD, где способ маркировки кадров отличен от Data-CD (на аудио CD кадры не имеют специального заголовка и для определения смещения каждого кадра необходимо следить за информацией в кадре). Это означает, что если при чтении Data-CD привод легко «ориентируется» на диске и никогда не перепутает кадры, то при чтении с аудио компакт диска привод не может ориентироваться четко, что при появлении, скажем, царапины или пыли может привести к чтению неправильного кадра и, как следствие, скачку или треску звучания. Эта же проблема
(неспособность большинства приводов правильно позиционироваться на CD-DA) является причиной еще одного неприятного эффекта: копирование информации с
Audio CD вызывает проблемы даже при работе с полностью сохранными дисками вследствие того, что правильное «ориентирование на диске» полностью зависит от считывающего привода и не может быть четко проконтролировано программным путем.

Повсеместное распространение и дальнейшее развитие уже упомянутых lossy-кодеров аудио (MP3, AAC и других) открыло широчайшие возможности распространения и хранения аудио. Современные каналы связи уже давно позволяют пересылать большие массивы данных за сравнительно небольшое время, однако самой медленной остается передача данных между конечным пользователем и поставщиком услуг связи. Телефонные линии, по которым пользователи в большинстве своем связываются с Интернетом, не позволяют осуществлять быструю передачу данных. Нечего и говорить, что такие объемы данных, какие занимает несжатая аудио и видео информация, передавать по привычным каналам связи придется очень долго. Однако появление lossy- кодеров, обеспечивающих десяти-пятнадцати кратное сжатие, превратило передачу и обмен аудио данными в повседневное занятие каждого пользователя
Интернета и сняло все преграды, образованные слабыми каналами связи.
Касательно этого нужно сказать, что развивающаяся сегодня семимильными шагами цифровая мобильная связь во многом обязана именно lossy-кодированию.
Дело в том, что протоколы передачи аудио по каналам мобильной связи работают на приблизительно тех же принципах, что и известные всем музыкальные кодеры. Поэтому дальнейшее развитие в области кодирования аудио неизменно ведет к уменьшению стоимости передачи данных в мобильных системах, от чего конечный пользователь только выигрывает: дешевеет связь, появляются новые возможности, продлевается время работы батарей мобильных устройств и т.д. Не в меньшей степени lossy-кодирование помогает экономить деньги на покупке дисков с любимыми песнями – сегодня стоит только зайти в
Интернет и там можно найти почти любую интересующую песню. Безусловно, такое положение вещей давно «мозолит глаза» звукозаписывающим компаниям – у них под носом люди вместо покупки дисков обмениваются песнями прямо через
Интернет, что превращает некогда золотое дно в малоприбыльный бизнес, но это уже вопрос этики и финансов. Одно можно сказать с уверенностью: с таким положением вещей уже ничего нельзя поделать и бум обмена музыкой через
Интернет, порожденный именно появлением lossy-кодеров, уже ничем не остановить. А это только на руку рядовому пользователю.

Д. К вопросу об обработке звука

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

1. Амплитудные преобразования. Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

2. Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну.

3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или «объёмности» звука.

4. Временные преобразования. Реализуются путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

Обсуждение каждого из названных типов преобразований может стать целым научным трудом. Стоит привести несколько практических примеров использования указанных видов преобразований при создании реальных звуковых эффектов:

Echo (эхо) Реализуется с помощью временных преобразований. Фактически для получения эха необходимо на оригинальный входной сигнал наложить его задержанную во времени копию. Для того, чтобы человеческое ухо воспринимало вторую копию сигнала как повторение, а не как отзвук основного сигнала, необходимо время задержки установить равным примерно 50 мс. На основной сигнал можно наложить не одну его копию, а несколько, что позволит на выходе получить эффект многократного повторения звука (многоголосного эха).
Чтобы эхо казалось затухающим, необходимо на исходный сигнал накладывать не просто задержанные копии сигнала, а приглушенные по амплитуде.

Reverberation (повторение, отражение). Эффект заключается в придании звучанию объемности, характерной для большого зала, где каждый звук порождает соответствующий, медленно угасающий отзвук. Практически, с помощью реверберации можно «оживить», например, фонограмму, сделанную в заглушенном помещении. От эффекта «эхо» реверберация отличается тем, что на входной сигнал накладывается задержанный во времени выходной сигнал, а не задержанная копия входного. Иными словами, блок реверберации упрощенно представляет собой петлю, где выход блока подключен к его входу, таким образом уже обработанный сигнал каждый цикл снова подается на вход смешиваясь с оригинальным сигналом.

Chorus (хор). В результате его применения звучание сигнала превращается как бы в звучание хора или в одновременное звучание нескольких инструментов. Схема получения такого эффекта аналогична схеме создания эффекта эха с той лишь разницей, что задержанные копии входного сигнала подвергаются слабой частотной модуляции (в среднем от 0.1 до 5 Гц) перед смешиванием со входным сигналом. Увеличение количества голосов в хоре достигается путем добавления копий сигнала с различными временами задержки.

Безусловно, как и во всех других областях, в обработке сигналов также имеются проблемы, которые являются своего рода камнем преткновения. Так, например, при разложении сигналов в спектр частот существует принцип неопределенности, который невозможно преодолеть. Принцип гласит, что нельзя получить точную спектральную картину сигнала в конкретный момент времени: либо для получения более точной спектральной картины нужно проанализировать больший временной участок сигнала, либо, если нас интересует больше время, когда происходило то или иное изменение спектра, нужно пожертвовать точностью самого спектра. Иными словами нельзя получить точный спектр сигнала в точке - точный спектр для большого участка сигнала, либо очень приблизительный спектр, но для короткого участка.

Е. Аппаратура

Немаловажная часть разговора о звуке связана с аппаратурой. Существует много различных устройств для обработки и ввода/вывода звука. Касательно обычного персонального компьютера следует подробнее остановиться на звуковых картах. Звуковые карты принято делить на звуковые, музыкальные и звукомузыкальные. По конструкции же все звуковые платы можно разделить на две группы: основные (устанавливаемые на материнской плате компьютера и обеспечивающие ввод и вывод аудио данных) и дочерние (имеют принципиальное конструктивное отличие от основных плат - они чаще всего подключаются к специальному разъему, расположенному на основной плате). Дочерние платы служат чаще всего для обеспечения или расширения возможностей MIDI- синтезатора.

Звукомузыкальные и звуковые платы выполняются в виде устройств, вставляемых в слот материнской платы (либо уже встроены в нее изначально).
Визуально они имеют обычно два аналоговых входа - линейный и микрофонный, и несколько аналоговых выходов: линейные выходы и выход для наушников. В последнее время карты стали оснащаться также и цифровым входом и выходом, обеспечивающим передачу аудио между цифровыми устройствами. Аналоговые входы и выходы обычно имеют разъемы, аналогичные разъемам головных наушников (1/8”). Вообще, входов у звуковой платы немного больше, чем два: аналоговые CD, MIDI и другие входы. Они, в отличие от микрофонного и линейного входов, расположены не на задней панели звуковой платы, а на самой плате; могут иметься и другие входы, например, для подключения голосового модема. Цифровые входы и выходы обычно выполнены в виде интерфейса S/PDIF (интерфейс цифровой передачи сигналов) с соответствующим разъемом (S/PDIF – сокращение от Sony/Panasonic Digital Interface - цифровой интерфейс Sony/Panasonic). S/PDIF - это «бытовой» вариант более сложного профессионального стандарта AES/EBU (Audio Engineering Society /
European Broadcast Union). Сигнал S/PDIF используется для цифровой передачи
(кодирования) 16-разрядных стерео данных с любой частотой дискретизации.
Помимо перечисленного, на звукомузыкальных платах имеется MIDI-интерфейс с разъемами для подключения MIDI-устройств и джойстиков, а также для подсоединения дочерней музыкальной карты (хотя в последнее время возможность подключения последней становится редкостью). Некоторые модели звуковых карт для удобства пользователя оснащаются фронтальной панелью, устанавливаемой на лицевой стороне системного блока компьютера, на которой размещаются разъемы, соединенные с различными входами и выходами звуковой карты.

Определим несколько основных блоков, из которых состоят звуковые и звукомузыкальные платы.

1. Блок цифровой обработки сигналов (кодек). В этом блоке осуществляются аналого-цифровые и цифро-аналоговые преобразования (АЦП и
ЦАП). От этого блока зависят такие характеристики карты, как максимальная частота дискретизации при записи и воспроизведении сигнала, максимальный уровень квантования и максимальное количество обрабатываемых каналов (моно или стерео). В немалой степени от качества и сложности составляющих этого блока зависят и шумовые характеристики.

2. Блок синтезатора. Присутствует в музыкальных картах. Выполняется на основе либо FM-, либо WT-синтеза, либо на обоих сразу. Может работать как под управлением собственного процессора, так и под управлением специального драйвера.

3. Интерфейсный блок. Обеспечивает передачу данных по различным интерфейсам (например, S/PDIF). У чисто звуковой карты этот блок чаще отсутствует.

4. Микшерный блок. В звуковых платах микшерный блок обеспечивает регулировку: уровней сигналов с линейных входов; уровней с MIDI входа и входа цифрового звука; уровня общего сигнала; панорамирования; тембра.

Рассмотрим важнейшие параметры, характеризующие звуковые и звукомузыкальные платы. Наиболее важными характеристиками являются: максимальная частота дискретизации (sampling rate) в режиме записи и в режиме воспроизведения, максимальный уровень квантования или разрядность
(max. quantization level) в режиме записи и воспроизведения. Кроме того, так как звукомузыкальные платы имеют еще и синтезатор, то к их характеристикам относят и параметры установленного синтезатора.
Естественно, чем с большим уровнем квантования карта способна кодировать сигналы, тем большее качество сигнала при этом достигается. Все современные модели звуковых карт способны кодировать сигнал с уровнем 16 бит, и в поледнее время появились бытовые карты с уровнем в 24 бит (линейка карт
Audigy, Audigy II от Creative). Одной из важных характеристик является возможность одновременного воспроизведения и записи звуковых потоков.
Особенность карты одновременно воспроизводить и записывать называют полнодуплексной (full duplex). Есть еще одна характеристика, которая зачастую играет решающую роль при покупке звуковой карты - отношение сигнал/шум (Signal/Noise Ratio, S/N). Этот показатель влияет на чистоту записи и воспроизведения сигнала. Отношение сигнал/шум – это отношение мощности сигнала к мощности шума на выходе устройства, этот показатель принято измерять в дБ. Хорошим можно считать отношение 80-85 дБ; идеальным
– 95-100 дБ. Однако нужно учитывать, что на качество воспроизведения и записи сильно влияют наводки (помехи) со стороны других компонент компьютера (блока питания и проч.). В результате этого отношение сигнал/шум может изменяться в худшую сторону. На практике методов борьбы с этим существует достаточно много. Некоторые предлагают заземлить компьютер.
Другие, дабы как можно более тщательно уберечь звуковую карту от наводок,
«выносят» ее за пределы корпуса компьютера. Однако полностью уберечься от наводок очень тяжело, так как даже элементы самой карты создают наводки друг на друга. С этим тоже пытаются бороться и для этого экранируют каждый элемент на плате. Но сколько бы усилий не прилагалось к решению этой проблемы, полностью исключить влияние внешних помех невозможно.

Еще одна не менее важная характеристика – коэффициент нелинейных искажений или Total Harmonic Distortion, THD. Этот показатель также критическим образом влияет на чистоту звучания. Коэффициент нелинейных искажений измеряется в процентах: 1% - «грязное» звучание; 0.1% - нормальное звучание; 0.01% - чистое звучание класса Hi-Fi; 0.002% - звучание класса Hi-Fi – Hi End.. Нелинейные искажения – результат неточности в восстановлении сигнала из цифрового вида в аналоговый.
Упрощенно, процесс измерения этого коэффициента проводится следующим образом. На вход звуковой карты подается чистый синусоидальный сигнал. На выходе устройства снимается сигнал, спектр которого представляет собой сумму синусоидальных сигналов (сумма исходной синусоиды и ее гармоник).
Затем по специальной формуле рассчитывается количественное соотношение исходного сигнала и его гармоник, полученных на выходе устройства. Это количественное соотношение и есть коэффициент нелинейных искажений (THD).

Что такое MIDI-синтезатор? Термин «синтезатор» обычно используется применительно к электронному музыкальному инструменту, в котором звук создается и обрабатывается, меняя свою окраску и характеристики.
Естественно, название этого устройства пошло от его основного предназначения – синтеза звука. Основных методов синтеза звука существует всего два: FM (Frequency modulation – частотная модуляция) и WT (Wave Table
– таблично-волновой). Поскольку мы не можем здесь подробно останавливаться на их рассмотрении, опишем лишь основную идею методов. В основе FM-синтеза лежит идея, что любое даже самое сложное колебание является по сути суммой простейших синусоидальных. Таким образом, можно наложить друг на друга сигналы от конечного числа генераторов синусоид и путем изменения частот синусоид получать звуки, похожие на настоящие. Таблично-волновой синтез основывается на другом принципе. Синтез звука при использовании такого метода достигается за счет манипуляций над заранее записанными
(оцифрованными) звуками реальных музыкальных инструментов. Эти звуки (они называются сэмплами) хранятся в постоянной памяти синтезатора.

Надо отметить, что поскольку MIDI-данные – это набор команд, то музыка, которая написана с помощью MIDI, также записывается с помощью команд синтезатора. Иными словами, MIDI-партитура – это последовательность команд: какую ноту играть, какой инструмент использовать, какова продолжительность и тональность ее звучания и так далее. Знакомые многим
MIDI-файлы (.MID) есть нечто иное, как набор таких команд. Естественно, что поскольку имеется великое множество производителей MIDI-синтезаторов, то и звучать один и тот же файл может на разных синтезаторах по-разному (потому что в файле сами инструменты не хранятся, а есть лишь только указания синтезатору какими инструментами играть, в то время как разные синтезаторы могут звучать по-разному).

Вернемся к рассмотрению звукомузыкальных плат. Поскольку мы уже уточнили, что такое MIDI, нельзя обойти стороной характеристики встроенного аппаратного синтезатора звуковой карты. Современный синтезатор, чаще всего, основан на так называемой «волновой таблице» - WaveTable (вкратце, принцип работы такого синтезатора состоит в том, что звук в нем синтезируется из набора записанных звуков путем их динамического наложения и изменения параметров звучания), раньше же основным типом синтеза являлся FM
(Frequency Modulation – синтез звука посредством генерирования простых синусоидальных колебаний и их смешения). Основными характеристиками WT- синтезатора являются: количество инструментов в ПЗУ и его объем, наличие
ОЗУ и его максимальный объем, количество возможных эффектов обработки сигналов, а также возможность поканальной эффект-обработки (конечно, в случае наличия эффект-процессора), количество генераторов, определяющих максимальное число голосов в полифоническом (многоголосном) режиме и, может быть самое главное, стандарт, в соответствии с которым выполнен синтезатор
(GM, GS или XG). Кстати, объем памяти синтезатора - не всегда величина фиксированная. Дело в том, что в последнее время синтезаторы перестали иметь свое ПЗУ, а пользуются основным ОЗУ компьютера: в этом случае все используемые синтезатором звуки хранятся в файле на диске и при необходимости считываются в ОЗУ.

Ж. Программное обеспечение

Тема программного обеспечения очень широка, поэтому рассмотрим небольшую толику программ для обработки звука.

Наиболее важный класс программ – редакторы цифрового аудио. Основные возможности таких программ это, как минимум, обеспечение возможности записи
(оцифровки) аудио и сохранение на диск. Развитые представители такого рода программ позволяют намного больше: запись, многоканальное сведение аудио на нескольких виртуальных дорожках, обработка специальными эффектами (как встроенными, так и подключаемыми извне – об этом позже), очистка от шумов, имеют развитую навигацию и инструментарий в виде спектроскопа и прочих виртуальных приборов, управление/управляемость внешними устройствами, преобразование аудио из формата в формат, генерация сигналов, запись на компакт диски и многое другое. Некоторые из таких программ: Cool Edit Pro
(Syntrillium), Sound Forge (Sonic Foundry), Nuendo (Steinberg), Samplitude
Producer (Magix), Wavelab (Steinberg), Dart.

Основные возможности редактора Cool Edit Pro 2.0 (см. Скриншот 1 - пример рабочего окна программы в многодорожечном режиме): редактирование и сведение аудио на 128 дорожках, 45 встроенных DSP-эффектов, включая инструменты для мастеринга, анализа и реставрации аудио, 32-битная обработка, поддержка аудио с параметрами 24 бит / 192 КГц, мощный инструментарии для работы с петлями (loops), поддержка DirectX, а также управление SMPTE/MTC, поддержка работы с видео и MIDI и прочее.

Скриншот 1.

Основные возможности редактора Sound Forge 6.0a (см. Скриншот 2 - пример рабочего окна программы): мощные возможности не деструктивного редактирования, многозадачная фоновая обработка заданий, поддержка файлов с параметрами до 32 бит / 192 КГц, менеджер предустановок, поддержка файлов более 4 Гб, работа с видео, большой набор эффектов обработки, восстановление после зависаний, предпрослушивание примененных эффектов, спектральный анализатор и прочее.

Сриншот 2

Специализированные реставраторы аудио играют также немаловажную роль в обработке звука. Такие программы позволяют восстановить утерянное качество звучания аудио материала, удалить нежелательные щелчки, шумы, треск, специфические помехи записей с аудио-кассет, и провести другую корректировку аудио. Программы подобного рода: Dart, Clean (от Steinberg
Inc.), Audio Cleaning Lab. (от Magix Ent.), Wave Corrector.

Основные возможности реставратора Clean 3.0 (см. Скриншот 3 – рабочее окно программы): устранение всевозможных потрескиваний и шумов, режим автокоррекции, набор эффектов для обработки скорректированного звука, включая функцию «surround sound» с наглядным акустическим моделированием эффекта, запись CD с подготовленными данными, «интеллигентная» система подсказок, поддержка внешних VST плаг-инов и другие возможности.

Скришот 3

Часть вторая: больше практическая

В последнее время актуальной стала тема архивации старых виниловых дисков и кассет. Сегодня все слушают музыку на компьютерах, и иногда обидно, что нам не доступны старые записи.

Оцифровка музыки

Попробуйте дать своим старым пластинкам и аудиокассетам новую жизнь. До середины восьмидесятых годов любители музыки разделялись на два лагеря: специалистов, которые знали, как поддерживать драгоценные виниловые пластинки и пленки в прекрасном состоянии, и любителей, которые не обращали внимания на следы пальцев или царапины на поверхности пластинки. Сейчас таких проблем уже нет. CD компактнее, и их труднее повредить. Когда CD получили широкое распространение, граммофонные пластинки были отправлены на пенсию. Конечно, только в цифровом веке музыкальные сокровища могут продолжить радовать слушателей: обработайте старые записи на компьютере и запишите их на CD!

1. Подключение проигрывателя к компьютеру

Прежде всего подсоедините проигрыватель к компьютеру. Это можно сделать несколькими способами. У некоторых проигрывателей есть свой собственный усилитель - соедините его с входом Line-in звуковой карты. Если у вашего проигрывателя собственного усилителя нет и сигнал слишком слаб, используйте какой-нибудь внешний усилитель, например музыкальный центр. Кабели с различными разъемами для этих целей можно приобрести в магазинах или палатках с электротехникой. Если вам нужен кабель с необычной комбинацией разъемов, которого нет в продаже, купите необходимые штекеры отдельно и сделайте нужный кабель сами. Будьте осторожны и следите за тем, чтобы не появилась петля: потом она будет вызывать шум. Чтобы избежать этого, соедините дополнительно земляной кабель проигрывателя с корпусом компьютера. Было бы весьма желательно предварительно прослушать то, что мы хотим реставрировать, так как «сюрприз» в виде «вжик, заело пластинку» будет не очень-то кстати во время записи фонограммы на HDD. Если такая бяка обнаружена, то регулируем нагрузку на звукосниматель, в случае же отсутствия регулировки придется положить какой-либо груз на головку тонарма
(очень нежелательно, но другого выхода нет). Если все прошло успешно то в колонках (наушниках) есть шанс услышать благодатные звуки песка винилового кругляка или неподавленный шум прибоя из что-нибудь вроде МП «Яуза 221-1С» с МК-60, тип I.

2. Настройка возможностей звуковой карты

При помощи программы "Регулятор громкости" в Windows настройте уровень входящего сигнала. Для этого два раза левой кнопкой мыши щелкните по иконке динамика в трее. Регуляторы уровня Line-in и Wave должны быть включены.
Более того, передвижной регулятор громкости должен стоять не ниже середины линейки. Мощным источником помех часто является микрофонный вход. Часто он производит ненужные шумы, поэтому для него напротив надписи "Выключить" должна стоять галочка. Теперь настроим параметры записи. Откройте в
"Регуляторе громкости" закладку "Параметры" - "Свойства". В опции
"Настройка громкости" выберите параметр "Запись", в поле "Отображать регуляторы громкости" на строке Line-in обязательно должна стоять галочка.
Щелкните по кнопке OK. В "Регуляторе громкости" выберите источник записи - в нашем случае это будет Line-in. Установите передвижной регулятор примерно посередине линейки. Окно "Регулятора громкости" пока пусть остается открытым.

3.Реставрация

Теперь, собственно говоря, можно двинуться от желаемого к действительному.
Существует достаточное количества софта для реставрации старых записей.
Есть профессиональные решения, для звукорежиссеров, которые ближе к звуковым редакторам, в которых обычному пользователю разобраться можно будет лет через пять.
За это время то, что можно было восстановить, будет потеряно безвозвратно.
К великому счастью есть в этом мире программы, в которых можно разобраться довольно быстро и получить достаточно высокое качество конечного материала.
Одно из таких решений – CoolEdit от фирмы Syntrillium
(www.syntrillium.com) звуковой редактор с возможностью записи и обработки музыки.
Ну как, скачали программу? Установили? Надеюсь, что вы не забыли и про плагин «Audio Cleanup», который нам ох как пригодится. Давайте запустим редактор и посмотрим на главное окно программы (рис. 2). Стандартный
Windows интерфейс (в определенной мере, как часто говорят, интуитивно- понятный). Давайте договоримся таким образом: подробного рассказа о всех возможностях программы «Cool Edit 2000» версии 1.1 здесь не будет.
Рассмотрим только то, что нам действительно будет необходимо для реставрации звука.

Теперь пришла пора сделать небольшую, но очень важную настройку некоторых параметров программы. Поясню для чего: наверняка многие пользователи, читающие эти строки, не захотят ограничиваться очисткой звука с виниловых носителей, поскольку обычные компакт-кассеты еще никто не отменял. А что вы скажете о записи голоса с микрофона? Владельцам карточки «SB Live!» будет нелишне прочесть следующий небольшой абзац.

Практически все владельцы стационарных кассетников знают, что частотный диапазон записанной информации лежит в пределах 40-14 000 Гц в случае кассеты с лентой 1-го типа. Лента на основе хромдиоксида дает более широкий диапазон. Но мало кто знает, что магнитофон все равно воспроизводит отдельные «крики души» и в еще более широком диапазоне (20-20 000 Гц), каковые, будучи забиты всевозможными шумами и помехами, не достигают нежного уха меломана. Программа «Cool Edit» позволяет исправить этот недостаток и выровнять амплитудно-частотную характеристику кассетника до вполне приличного уровня.

Теперь специально для счастливых обладателей карточки «SB Live!»: вы наверняка знаете, что АЧХ кодека совсем не идеальна, и уже после 4,5 кГц начинается ступенчатый спад уровня верхних частот, что во многих случаях не есть хорошо. При помощи «Cool Edit» мы преодолеем и это препятствие.

Для исправления вышеназванных недостатков займемся настройкой FFT-фильтра редактора, который будет нашим помощником на начальном этапе очистки звука.
Откроем любой wav-файл или запишем несколько секунд тишины, нажав кнопку с красной точкой, расположенной в кнопочной панели в правом нижнем углу.
Затем зайдем в меню программы: Transform-Filters-FFT Filter. В открывшемся окне (рис. 2) создадим любой, абсолютно бездумный пресет (настройку), для чего мышью немного потаскаем желтую линию. При помощи кнопки «Add» обзовем нашу настройку любым цензурным именем и сохраним. Для чего? А для того, что сейчас мы будем редактировать файл «Cool.ini», проживающий по адресу:
Х:Program Files Cool2000. А именно, - путем внесения некоторых дополнительных параметров для исправления досадных недоработок кассетника и карточки «SB Live!».
Открываем файл «Сool.ini», где ищем раздел . Но нюанс в том, что данный раздел в этом файле появляется только после того, как мы воспользуемся услугами FFT-фильтра. Вот зачем нам были нужны телодвижения с созданием некоего абстрактного пресета. Теперь смотрим, где в разделе
находится созданная нами настройка - просто находим имечко, которым мы обозвали наш пресет. А дальше несложно: в свободной строке прописываем вот такой «крохотный» параметр:

Item29=МСRESTORATION,3,19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,
6,3179,9,3444,1,3583,28,3688,42,3773,48,3848,61,3925,76,3957,96,3998,100,
4004,100,4012,5,4096,5,19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,6,3179,

9,3444,21,3583,28,3688,42,3773,48,3848,61,3925,76,3957,96,3998,100,4004,100,

4012,5,4096,5,2,0,12000,1,2,0,0,1000,100,5,-10,100,-
0.5,12,24000,1,0,1,1,48000

Записываем эту цифирь непременно в одну строчку! Это параметры для исправления АЧХ у кассетных магнитофонов. Игорь Бабайлов любезно поделился отредактированным файлом Cool.ini, над которым прокорпел много дней и ночей: www.hot.ee/uvs/Cool.zip. За что ему нижайший поклон.
Не думаю, что параметры АЧХ у разных кассетных приставок будут сильно различаться. С другой стороны, если вы потратили много-много вечнозеленых на «Dragon Nacamichi» или «Maranz», то эти настройки Вам явно не нужны.
Для обладателей «SB Live!» настоятельно рекомендовано любую записанную фонограмму сначала пропустить через этот фильтр со следующим пресетом:

Item36=SBCORRECtion,3,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,
10,2391,12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,
56,3726,70,3825,89,4096,100,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,
2046,10,2391,12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,
3628,56,3726,70,3825,89,4096,100, 2,0,12000,1,2,0,0,1000,100,3, -10,100,0,
14,24000,1,0,0,1,48000

Данное значение прописываем все в том же Сool.ini и в том же разделе
, не забывая, что запись параметров должна идти одной неразрывной строкой.
Поскольку компьютер с проигрывателем у нас соединены, проверены на работоспособность и готовы к труду, а программа «Cool Edit 2000» после внесения дополнений чувствует себя прекрасно, то можно смело приступать к процессу записи фонограммы на «хард».
Начинаем запись либо через «File» - «New», либо нажмем кнопку записи на панели. Не бойтесь, запись сразу не начнется: нам будет предложено выбрать характеристики записываемого сигнала. В открывшемся окошке выберем Sample
Rate =44100 и 16-битный звук в стереорежиме - а зачем нам моно? Ставим тонарм на пластинку, и при нажатии кнопки ОК начнется запись, о чем будет свидетельствовать индикатор записи в виде пульсирующих красных полос и таймера. Было бы весьма желательно произвести запись конкретной вещи с захватом пустых участков в начале и конце фонограммы, т. е. там, где слышен только шорох самой массы - это нам понадобится в дальнейшем для глубокой очистки звука. Можно даже захватить несколько секунд предыдущей или последующей композиции.
В нужном нам месте нажимаем кнопку Stop, и в окне программы наблюдаем записанную фонограмму (рис. 3).

Рис.3
Сохраним записанный шедевр в wav-файл (File - Save as). Далее, если у вас используется «SB Live!», открываем уже знакомый нам FFT-фильтр (Transform-
Filters-FFT Filter) и, выбрав пресет SBCORRECtion и нажав кнопку ОК, начинаем выравнивать АЧХ записанного сигнала (рис. 4). Далее приступаем к удалению тресков и щелчков полученной фонограммы 2.

Для чего все вместе отправляются в меню Transform-Noise Reduction-Click/
Pop Eliminator, где в открывшемся окне выбираются наиболее оптимальные параметры очистки звука (данные были представлены профессиональными реставраторами, съевшими не одну собаку на этом деле).
На рис. 5 эти параметры представлены на всеобщее обозрение. Но вначале нам нужно нажать кнопку Auto Find All Levels, а уж потом на ОК для запуска процесса очистки звука.

Если после увеличения мы не нашли начальный участок - не пугайтесь, а подведите курсор мыши к ползунку вверху рисунка и сдвиньте этот ползунок влево, где и найдете начало фонограммы. Теперь мышью выделяйте начальный участок с шумом, соответствующий примерно 3 секундам звучания (время указано на панельке снизу), и в меню Transform-Noise, Reduction-Noise,
Reduction при помощи кнопки Get Profile from Selection сделаем снимок столь ненавистного нам шума. Но предварительно выставим наиболее оптимальные значения некоторых параметров, которые можно увидеть на рис. 7 вместе со снимком шума. А чтобы услышать предварительный результат работы шумодава, нажмем на кнопку Preview, не забыв заранее выделить очищаемую фонограмму.
Если результат устраивает, нажимаем кнопку ОК и начинаем процесс шумоподавления, длящийся намного меньше, нежели очистка сигнала от треска и щелчков. После окончания не будет лишним сохранить полученный результат под другим именем, чтобы иметь представление о всех ступенях очистки звука.

Следует сказать, что после полной очистки фонограммы от шумов уровень сигнала весьма ощутимо снижается, а, следовательно, придется нормализовать сигнал при помощи команды Transform-Amplitude-Normalize, что займет совсем немного времени.
Наконец настала пора провести заключительную фазу нашего процесса, а именно - обрезку нашей фонограммы по краям, и сохранение ее, родимой, в файле. Сразу скажу, что обрезать ненужные начальный и конечный участок звукового файла можно и в «Cool Edit» при помощи выделения ненужного участка и команды Edit-Cut.
Для тех, кто хочет перевести в цифровую форму записи с компакт-кассет, задача упрощается ровно на один этап - очистку фонограммы от шума и щелчков. После окончания записи музыки на хард, в FFT-фильтре выбираем настройку MCRESTORation, выравниваем АЧХ сигнала с кассетника, а дальше просто начинаем процесс шумоподавления и нормализации сигнала.
Ну-с, приведенный в божеский вид, очищенный и подстриженный кусок фонограммы сохраняем кому как нравится - wav-формат или иной. С первым можно делать что угодно, вплоть до кодирования в МР3. Да чуть не забыл, нужно же еще записать все это дело на CD, что бы потом комфортно можно было послушать где-нибудь на плеере у друзей, раздувая щеки и ноздри от собственной значимости в процессе обновления звука.

В итоге вы должны записать на CD подготовленные звуковые файлы.

4. Подготовка файлов

Теперь запишем музыку на CD. Используем Nero. Другие программы, разумеется, работают аналогично. Запустите Nero и выберите Compile a new CD и Audio-CD.
Откроется просмотр композиций и диспетчер файлов. Перетащите WAV-файлы в окно композиций. Перетаскиванием в этом окне можно изменять порядок файлов.
Потом выделите все композиции, щелкните по ним правой кнопкой и выберите
Properties. Установите длину пауз между композициями. Если паузы существуют уже в самих файлах, то это значение лучше всего установить как ноль. После этого вызовите закладку Filters. Здесь также находятся инструменты для улучшения качества звука. С помощью функции нормализации можно выровнять громкость отдельных композиций: Подчеркните поле Normalize и в качестве метода установите Maximum. Nero настроит у всех композиций возможную максимальную громкость таким образом, чтобы не произошло искажений звука.
Закройте диалог щелчком по ОК.

5. Разделение файла wave на отдельные композиции

Теперь разделите большие файлы на отдельные части, с тем чтобы проигрыватель CD распознал композиции. Щелкните по соответствующему файлу и снова откройте диалог Properties. Вызовите закладку Indexes, Limits, Split.
Nero последовательно отобразит звуковые волны. Потом осуществите разделение: там, где у волны отобразится зарубка, находится предполагаемое начало композиции. Действительно ли это так, вы выясните, если щелкните по этому месту и нажмете Play. Если речь идет о переходе, выделите диапазон и щелкните по Zoom In. Щелчком мыши вставьте серую линию в то место, где вы хотите разделить композиции. Потом щелкните по Split. Перейдите в Full
View, в случае необходимости повторите все еще раз и в заключение подтвердите сделанное нажатием ОК. С помощью "Свойств" присвойте названия отдельным композициям. После этого нажмите в панели инструментов кнопку для записи CD, установите скорость, щелкните по Write - и все, Вы обладатель собственного шедевра!

6. Перспективы и проблематика

Перспективы развития и использования цифрового аудио видятся очень широкими. Казалось бы, все, что можно было сделать в этой области, уже сделано. Однако это не так. Остается масса еще совсем незатронутых проблем.

Например, область распознавания речи еще очень не развита. Давно уже делались и делаются попытки создать программное обеспечение, способное качественно распознавать речь человека, однако все они пока не приводят к желаемому результату. А ведь долгожданный прорыв в этой области мог бы неимоверно упростить ввод информации в компьютер. Только представьте себе, что вместо набора текста его можно было бы просто надиктовывать, попивая кофе где-нибудь неподалеку от компьютера. Имеется множество программ якобы способных предоставить такую возможность, однако все они не универсальны и сбиваются при незначительном отклонении голоса читающего от заданного тона.
Такая работа приносит не столько удобств, сколько огорчений. Еще куда более сложной задачей (вполне возможно, что и неразрешимой вовсе) является распознавание общих звуков, например, звучания скрипки в звуках оркестра или выделение партии рояля. Можно надеяться, что когда-нибудь такое станет возможным, ведь человеческий мозг легко справляется с такими задачами, однако сегодня говорить о хотя бы малейших сдвигах в этой области рано.

В области синтеза звука также есть пространство для изучения. Способов синтеза звука сегодня существует несколько, однако ни один из них не дает возможности синтезировать звук, который нельзя было бы отличить от настоящего. Если, скажем, звуки рояля или тромбона еще более-менее поддаются реализации, до правдоподобного звучания саксофона или электрогитары добиться еще так и не смогли – существует масса нюансов звучания, которые почти невозможно воссоздать искусственно.

Таким образом, можно смело сказать, что в области обработки, создания и синтеза звука и музыки еще очень далеко до того решающего слова, которое поставит точку на развитии этой отрасли человеческой деятельности.

7.Глоссарий терминов

1) DSP – Digital Signal Processor (цифровой сигнальный процессор).
Устройство (или программный механизм) предназначенное для цифровой обработки сигналов.

2) Битрейт – применительно к потокам данных - количество бит в секунду
(bits per second). Применительно в звуковым файлам (например, после lossy- кодирования) – каким количеством бит описывается одна секунда аудио.

3) Звук - акустическая волна, распространяющаяся в пространстве; в каждой точке пространства может быть представлена функцией амплитуды от времени.

4) Интерфейс - совокупность программных и аппаратных средств, предназначенных для организации взаимодействия различных устройств.

5) Интерполяция - отыскание промежуточных значений величины по некоторым известным ее значениям; отыскание значений функции f(x) в точках x, лежащих между точками xo