Еще в 1714 году знаменитый скрипач Тартини заметил и описал странное явление: когда на скрипке громко проигрываются две ноты, иногда можно отчетливо слышать третий тон, которого не было у исполнителя. Такие же дополнительные тоны можно услышать на звуках флейты при двухголосном звучании. Это явление вызвало большой интерес среди музыкантов и ученых, привело к постановке многочисленных экспериментов и позволило установить, что эти дополнительные «фантомные» тоны возникают непосредственно в слуховой системе и являются следствием ее нелинейности.
Интересно, что недопонимание этих процессов до сих пор приводит к недоразумениям, например, когда люди с тонким музыкальным слухом отчетливо слышат дополнительные тоны при исполнении некоторых аккордов, в то же время их коллеги могут их и не услышать. Особенно это касается людей старшего возраста, так как с возрастом слуховые пороги существенно меняются – чувствительность к высоким частотам уменьшается каждые десять лет примерно на 1000 Гц.
Учитывая огромные возможности для работы со звуком, которые предоставляют звукорежиссеру современные музыкальные технологии, им следует ознакомиться с теми звуковыми явлениями, к которым приводит нелинейность слуха.
По общему определению, система называется нелинейной, если выходной сигнал Y(t) отличается от входного сигнала X(t) наличием дополнительных спектральных составляющих. Обычно это имеет место, если связь между воздействующей силой (давлением) и откликом системы (смещением) является нелинейной. Практически вся электроакустическая аппаратура (громкоговорители, микрофоны, акустические системы и др.) является нелинейной (для оценки ее всегда нормируется коэффициент нелинейных искажений), однако эта нелинейность проявляется при достаточно больших уровнях входного сигнала.
Принципиальным отличием слухового аппарата является то, что он производит нелинейное преобразование входного звукового сигнала, как при большом его уровне, так и при очень малом, только механизмы этого преобразования различны.
Нелинейность слуха проявляется, прежде всего, в появлении «субъективных» или «слуховых» гармоник. При воздействии на барабанную перепонку достаточно громкого синусоидального звука с частотой f0 в процессе его обработки в слуховом аппарате возникают гармоники этого звука с частотами 2f0, 3f0 и т.д. Например, если подать первичный тон с частотой 500 Гц, то можно услышать звуки с частотами1000 Гц, 1500 Гц и т. д. Поскольку при объективных измерениях подводимого сигнала можно точно установить, что в спектре первичного воздействующего тона этих гармоник нет, они и получили название «субъективных» гармоник.
Наличие субъективных гармоник и их количественная оценка может быть выполнена с помощью прослушивания биений. Это явление возникает, если на систему подать два близких по частоте тоне, например 1000 Гц и 1010 Гц; тогда вместо двух тонов будет отчетливо слышен один тон со средней частотой 1005 Гц, модулированный по амплитуде разностной частотой 10 Гц. Если разницу между двумя тонами увеличивать, то при разности частот выше 15 Гц биения исчезают; сначала начинают прослушиваться два тона с большой шероховатостью (как если бы звучали одновременно два ненастроенных музыкальных инструмента), затем отчетливо слышны два чистых тона. К биениям слух очень чувствителен, поэтому использование биений – основной метод настройки музыкальных инструментов.
Если к звуку, под действием которого возникают субъективные гармоники, например, 500 Гц, добавить второй скользящий тон, частоту и уровень которого можно плавно изменять, то при неточном совпадении частоты этого звука с частотой субъективной гармоники (например, 990 Гц и 1000 Гц) можно услышать на фоне громкого основного звука биения с разностной частотой (fраз=10 Гц), возникшие в результате взаимодействия скользящего звука и субъективной гармоники. Аналогичные измерения могут быть сделаны и для гармоник более высоких порядков. Наиболее резкие биения будут прослушиваться при равенстве их амплитуд. Поэтому, отрегулировав амплитуду давления скользящего звука до получения наиболее четких биений и измерив величину этого давления, можно определить величину субъективной гармоники. Эта техника называется «метод наилучших биений» -method of best beats. Полученные результаты позволили установить зависимость величины этих субъективных гармоник от уровня основного тона: например, при уровне тона с частотой 1000 Гц, равном 80 дБ SPL, уровень второй субъективной гармоники оказался равным 63 дБ. Уровень этих гармоник существенно зависит от уровня основного тона – только тогда, когда он становится ниже 40 дБ, эти гармоники становятся малыми, и возникает ощущение чистого тона.
При увеличении уровня интенсивности первичного тона величина субъективных гармоник резко возрастает. Это обстоятельство имеет существенное значение для восприятия слухом низкочастотных колебаний в диапазоне от 16 Гц до примерно100 Гц.
Для того чтобы понять особенности слухового восприятия в этой области, вспомним, (см. предыдущую статью), что базилярная мембрана организована тонотопически, т. е. каждый тон имеет свою топографию размещения. В зависимости от спектрального состава на базилярной мембране возбуждаются различные участки, волосковые клетки находящиеся на этом месте возбуждаются и их электрическая активность сообщает мозгу, какие частоты присутствуют в спектре. Таким образом, базилярная мембрана выполняет функции спектрального анализатора с помощью линейки фильтров. Таким образом, звук с частотой 100 Гц воспринимается почти самым крайним участком базилярной мембраны близ ее верхушки, так что на базилярной мембране фактически нет участков, воспринимающих колебания более низких частот. Однако область слышимых звуков простирается значительно ниже (мы хорошо слышим частоты ниже 100 Гц). Предполагается, что звуки с частотой менее 100 Гц ощущаются не сами по себе, а из-за создаваемых ими серий субъективных гармоник, попадающих в область частот свыше 100 Гц, т. е. в конечном счете, из-за нелинейности слуха. Целый ряд фактов косвенно подтверждает эта предположение, однако прямого подтверждения еще не найдено, так что пока это гипотеза.
Второй формой проявления нелинейности слуха является появление «субъективных комбинационных тонов». Как известно, если к нелинейной системе подвести два сигнала достаточно большого уровня с частотами f1 и f2 (например, 800 Гц и 1000 Гц), то нелинейные искажения вызовут появление комбинационных тонов с различными частотами, т. е. появляются вторичные комбинационные тоны: f2 – f1 и f2 + f1 (200 Гц и 1800 Гц), кубичные комбинационные тоны 2f1- f2 (600 Гц), 2 f2 – f1 (1200 Гц), 2f1 + f2 (2600 Гц), 2f2 + f1 (2800 Гц) и др. Для их количественной оценки также могут быть использованы «метод наилучших биений» или метод «погашений» (подается дополнительный сигнал с частотой комбинационного тона и подбирается его амплитуда и фаза, пока комбинационный тон не погасится, т.е. он подается в противофазе). Многочисленные эксперименты показали, что существуют особые комбинационные тоны, которые чаще всего прослушиваются при субъективных экспертизах: это разностные тоны с частотами f2 – f1 и 2f1 – f2 (200 Гц и 600 Гц в нашем примере).
Простой разностный тон ведет себя, как в случае классической квадратичной нелинейности: он может быть услышан, если уровень первичных тонов больше, чем 50 дБ SPL; при равенстве уровней первичных тонов он увеличивается на 2 дБ; при возрастании уровня первичного тона на 1 дБ уровень этого тона не очень сильно зависит от отношения частот f2 / f1.
В случае кубичного разностного тона установлено, что он возникает в основном при соотношении частот 11,3. В этом частотном диапазоне он может быть услышан при очень низком уровне первичных тонов: ниже 40 дБ SPL уровень f2 может быть даже ниже 10 дБ. Увеличение амплитуды этого тона происходит не на 3 дБ при увеличении амплитуды первичного тона на 1 дБ (при равенстве их уровней) – как следовало бы при классической кубичной нелинейности – а существенно меньше. Все это заставляет предположить, что в образовании этих тонов участвуют некие дополнительные механизмы, которые мы рассмотрим далее.
Наконец, третий вид проявления нелинейности работы слухового аппарата – это нелинейная компрессия звукового сигнала. Уровень звукового сигнала в слышимом диапазоне меняется от 0 дБ до 120 дБ, т. е. амплитуда звукового давления меняется в 100 000 раз, в то же время динамический диапазон слухового нерва (от температурного шума до насыщения) составляет 1000. Поэтому, кроме функций спектрального анализатора, периферический слуховой аппарат выполняет функции нелинейного компрессора-усилителя.
Многочисленные исследования, особенно в последние годы, позволили получить ряд очень интересных результатов относительно механизмов возникновения нелинейности.
Слуховой аппарат состоит из трех отделов – внешнее, среднее и внутреннее ухо. Экспериментально доказано, что преобразование сигнала во внешнем и среднем ухе – процесс линейный, основная причина нелинейности – в механизме работы внутреннего уха (улитки). Улитка состоит из трех полостей, в которых находится жидкость (упрощенный разрез улитки показан на рис. 1). При ударе стремечка по мембране овального окна в жидкости возникает звуковой импульс, который распространяется из верхнего отдела в нижний и возбуждает базилярную мембрану. Исследования работы слуховой системы, выполненные знаменитым ученым Бекеши (Bekesy), за которые он получил Нобелевскую премию, показали, в частности, что при высоких уровнях сигнала в жидкости улитки образуются вихревые потоки. Поскольку ширина полостей разная, то этот процесс похож на образование околодонных завихрений, когда вода ударяется о берег (рис. 2а и рис. 2б). Появление этих завихрений искажает форму звукового импульса, а поскольку базилярная мембрана выполняет его спектральный анализ, то эти искажения и приводят к появлению дополнительных гармоник и комбинационных тонов.
Таким образом, первая причина возникновения нелинейных искажений – это гидродинамические процессы в жидкости улитки.
Чтобы рассмотреть вторую причину нелинейности, необходимо еще раз вернуться к механизму преобразования сигнала на базилярной мембране – механические смещения мембраны передаются органу Корти, это коллекция специальных нервных клеток, называемых волосковыми, расположенных рядами вдоль базилярной мембраны, часть этих клеток называется внутренними (ВВК), их порядка 4000, другая часть – наружными (НВК), их около 12000 (рис. 3). Волосковые клетки – это механо-электрический преобразователь, который конвертирует механические смещения мембраны в электрический потенциал, что вызывает поток электрических импульсов (в двоичном коде) в связанных с ними нервных волокнах, т. е. они работают аналогично аналого-цифровому преобразователю.
В последние годы удалось установить, что ВВК связаны в основном с восходящими нервными волокнами, т. е. они, в основном, сообщают звуковую информацию в высшие отделы мозга – это «слуховые микрофоны», а НВК – с нисходящими нервными волокнами, т. е. они в основном получают приказы от мозга. Именно эти наружные волосяные клетки и играют основную роль в нелинейной компрессии звука. При больших уровнях сигнала они удлиняются (на 10% от основной длины) и, тем самым, как бы придерживают смещения базилярной мембраны, предохраняя внутренние волосковые клетки от слишком большого изгиба, а на малых уровнях сигнала они усиливают смещения, как бы «подкачивая» энергию базилярной мембране. Это было выявлено с помощью очень тонких современных экспериментов, позволивших обнаружить на очень низких уровня сигнала отоакустическую эмиссию – т. е. излучение от внутреннего уха). Эта работа НВК на низких уровнях и вызывает, по-видимому, несколько аномальное поведение кубичных комбинационных тонов.
Измерения, выполненные с помощью анализа гамма-излучения от радиоактивного источника, размещенного на живой мембране, показали, что зависимость смещения базилярной мембраны от уровня сигнала имеет вид нелинейной компрессии. Нужно отметить, что этот механизм работает только в определенном диапазоне сигналов, при очень длительном воздействии громких звуков, а это сейчас происходит очень часто, НВК повреждаются и эта зависимость приобретает чисто линейный характер, что приводит к дальнейшему разрушению ВВК и слухового нерва.
Таким образом, появление слышимых «слуховых» гармоник и комбинационных тонов является признаком нормальной работы слухового аппарата и свидетельствует скорее о хорошем состоянии слуха.
В заключение хотелось бы еще раз отметить, что в механизме слухового восприятия звука заложена нелинейная процедура обработки, обусловленная как гидродинамическими процессами в улитке, так и электромеханическими преобразованиями в волосковых клетках. Нелинейность слуха проявляется как при больших, так и при малых уровнях звукового сигнала и играет существенную роль в слуховом восприятии музыкальных, речевых и шумовых сигналов. Это полезно учитывать в практике работы музыкантов и звукорежиссеров.
Автор: Алдошина А.И. (журнал «Звукорежиссер»)