Новости и статьи по автозвуку на МАГНИТОЛЕ
  • Tech Talks. Звуковая сцена в теории и на практике

    Одной из наиболее важных проблем для автомобильных аудиосистем всегда была и остается проблема построения правильной звуковой сцены. Это довольно сложная задача, и справиться с ней мешает многое: асимметричное относительно акустических систем положение слушателя, многократные отражения звука в салоне автомобиля и масса других ограничивающих факторов.Тем не менее во многих профессионально подготовленных автомобилях, да и в обычных любительских зачастую можно встретить стереосистемы, которые довольно точно выстраивают звуковую сцену, невзирая на все трудности. Как им это удается, и каков рецепт построения правильной звуковой сцены? На эти вопросы мы и постараемся ответить в рамках данной и нескольких последующих статей.

    Первую статью серии мы решили целиком посвятить теоретическим аспектам построения звуковой сцены, чтобы дать нашим читателям представление о том, как формируются звуковые образы, от чего зависит их положение в пространстве звуковой сцены и о многом другом.
    Мы надеемся, что даем в руки читателей информацию, с помощью которой они смогут решать практические проблемы. Хорошая теоретическая база позволит им самостоятельно и наилучшим образом настроить звуковую сцену в своем автомобиле, а также поможет в оценке достоинств и недостатков тех или иных вариантов расположения динамиков.
    Но о последнем мы расскажем чуть позже, а пока — теория...

    Прослушивая звучание „живой" музыки в концертном зале, мы без труда распределяем инструменты по ширине звуковой сцены, глубине и высоте. Например, мы точно знаем, что скрипки в составе оркестра звучат слева от центра сцены, барабаны располагаются где-то в глубине, а медные духовые звучат справа. Это знание основывается на визуальных и слуховых ощущениях, которые мы испытываем на концерте. Причем, слуховое ощущение не менее важно, чем зрительное, и в этом убеждает простой опыт: прослушивая музыку в концертном зале, прикройте на несколько секунд глаза, и постарайтесь определить, откуда звучат скрипки, барабаны и прочие инструменты. Скорее всего, и без поддержки зрения вы легко сможете выявить направление на источник звука и правильно распределить инструменты по звуковой сцене. Такая способность называется пространственной локализацией источников звука (так называют способность определять направление на источник звука), в ее основе лежит бинауральный эффект — от латинского bini (два) и auricula (ухо). Природа данного явления основывается на том, что уши человека расположены на некотором расстоянии друг от друга, вследствие чего звук, приходящий к ним, отличается по фазе и интенсивности, что, в свою очередь, приводит к заметным отличиям в импульсах, поступающих в центральную нервную систему от правого и левого уха. Обрабатывая эти импульсы, мозг выявляет отличия, и на их основании определяет направление на источник звука.
    Упомянув в начале статьи о трех измерениях звуковой сцены — ширине, высоте и глубине, — мы не сказали о том, что механизмы локализации для каждого из них заметно отличаются, что само по себе очень важно и достойно особого рассмотрения.

    Локализация по ширине
    Локализация по ширине обусловлена тремя физическими факторами: временным, интенсивностным и спектральным. Рассмотрим эти факторы более подробно.

    Временной механизм локализации
    Как уже говорилось, звуковая волна, достигающая правого и левого уха слушателя, проходит отличающийся по длине путь. Для правого уха он чуть меньший, для левого — больший (рис. 1).

    Отсюда вытекает первое и очень важное отличие между сигналами, поступающими в уши слушателя, — они отличаются временем прихода одинаковых фаз звука. Иначе говоря, звуковая волна, поступающая в ближнее к источнику звука ухо слушателя, опережает такую же звуковую волну, но направляющуюся ко второму — дальнему — уху.
    Количественно оценить отставание одной волны от другой несложно. Дополнительный путь, проходимый запаздывающей звуковой волной, схематично показан на рис. 2. Он равен отрезку между двумя точками — первой и третьей. Первая точка соответствует времени прихода фронта звуковой волны к ближнему к источнику звука уху слушателя, а третья — это не что иное, как левое ухо слушателя, путь звуковой волны до которого нам и предстоит оценить.


    Очевидно, что расстояние между указанными точками будет складываться из длины
    дуги, располагающейся между точками 2 и 3, и участка прямой между точками 1 и 2. Они будут равны, соответственно, аβ и asin(β) и в сумме составят (a)(β+sin(β)). Теперь, зная дополнительное расстояние, проходимое запаздывающей звуковой волной, нетрудно определить время, которое она на это тратит. Оно будет составлять (a/c)(β+sin(β)). В этой формуле: а — это среднестатистический радиус головы человека, (β — угол падения звуковой волны, с — скорость звука.
    Наверное, не для всех читателей оказался понятен скупой язык формул, поэтому, не вдаваясь в детали, мы сразу переходим к главному— к результатам вычислений. Они сведены в табл. 1, из которой видно, что если источник звука располагается непосредственно перед слушателем, разность времени прихода звуковой волны к ушам слушателя отсутствует, а в том случае, когда источник звука находится справа или слева от слушателя, разность хода максимальна и для „средней" головы составляет около 0,7 мс.

    Таблица 1. Значения разности времен прихода звуковой волны к левому и правому уху для разных значений угла падения звуковой волны

    Угол, градусы
    Временная разность, мс
    0,180 0
    10,170 0,05
    20,160 0,15
    30, 150 0,25
    40,140 0,34
    50,130 0,42
    60, 120 0,49
    70,110 0,55
    80,100 0,62
    90 0,7
    Значение временной разности в 0,7 мс мы не случайно назвали максимальным. Именно 0,7 мс являются своеобразной чертой раздела, за которой временной фактор уже не играет роли при локализации источниказвука. Почему? Ответ прост: если половина периода звукового колебания, поступающего с источника, меньше этого значения, то возникает фазовая неопределенность. Иными словами, фаза запаздывающего звукового сигнала (не соответствующего вышеуказанному требованию) на пути между точками 1 и 3 может изменяться неоднократно и в конце концов опередить фазу действительно опережающего сигнала, что в итоге приведет к неверному определению азимутального угла.
    Все звуковые колебания с частотами ниже 800 Гц соответствуют вышеуказанному требованию, эту область частот можно признать безраздельно подвластной временному фактору локализации. Что до более высоких частот, то нельзя однозначно сказать, что они не участвуют во временном механизме локализации. Напротив, участвуют, но только не в полной мере, а частично, при небольших отклонениях источника звука от центрального положения, т. е. от азимутального угла β=90°. При небольших углах фаза запаздывающей волны не успевает измениться настолько, чтобы вызвать фазовую неопределенность, поэтому временной механизм локализации все еще работает. Очевидно, что с ростом частоты звукового сигнала допустимое значение угла, при котором временной механизм еще работает, заметно уменьшается. Впрочем, это обстоятельство уже не столь существенно, потому что на частотах свыше одного-двух килогерц временной механизм локализации сменяется интенсивностным.

    Интенсивностный механизм локализации
    Как известно, с ростом частоты сигнала звуковые волны все менее охотно огибают препятствия, а при появлении таковых на своем пути быстро затухают. Голова человека представляет собой отличный пример такого препятствия, поэтому при расположении источника звука под некоторым углом к слушателю, в области одного из его ушей возникает своеобразная „акустическая тень", где наблюдается заметный спад интенсивности звука. Этот спад и является основным признаком, при помощи которого работает интенсивностный механизм локализации. Чем большую разницу обнаруживает мозг при сравнении интенсивностей звуковых сигналов, поступающих в правое и левое ухо слушателя, тем больше у „вычислительного" центра оснований полагать, что источник звука смещен на довольно значительный угол. Наибольшая разница в уровнях звукового давления по понятным причинам возникает при нахождении источника звука строго справа или слева от слушателя.
    Читатели, хорошо знакомые с явлением дифракции, в этот момент, наверное, уже отметили про себя: раз уж сравнение ведется по уровню звукового давления, а дифракция с ростом частоты сходит практически на нет, то есть все основания думать, что с увеличением частоты звукового сигнала интенсивностная разница будет заметно увеличиваться, а значит, и локализоваться звуки будут все более уверенней. Такое суждение верно лишь отчасти. Действительно, с ростом частоты звукового сигнала интенсивностная разница будет увеличиваться, но вот точности в локализации отнюдь не прибавится, — основные тона очень высоких частот практически не поддаются локализации. Кстати, то же самое можно сказать и о диапазоне нижнего и среднего баса. Они также не поддаются локализации по причине несостоятельности временного и ин-тенсивностного механизмов локализации. Первый механизм не справляется из-за отсутствия заметных фазовых отличий между звуковыми сигналами, поступающими в правое и левое ухо слушателя, а второй — из-за отсутствия интенсивностью различий. Впрочем, и третий, последний механизм локализации, тут также не у дел.

    Спектральный механизм локализации
    Этот механизм локализации является вспомогательным, он повышает остроту локализации по ширине звуковой сцены и вступает в дело, когда звуковой сигнал содержит смесь сложных звуков и импульсов, определяющих тембр музыкальных инструментов. Действие спектрального механизма локализации основывается на том, что при смещении источника звука, на одно ухо слушателя воздействует полный спектр звукового сигнала, а на второе — из-за некоторого ослабления ВЧ-составляющих только усеченная его часть.

    Локализация по высоте
    В вертикальном направлении механизмы локализации источников звука несколько отличаются от тех, что задействованы в горизонтальном, и это не лучшим образом сказывается на них— она заметно ухудшается. Причина, по которой наблюдается сильное снижение верности локализации заключена в том, что при определении направления на источник звука в расчет берутся не сами фазовые или интенсивностные отличия между сигналами, как в случае с локализацией по ширине, а их производные — сигналы, прошедшие сложную обработку в ушной раковине. Последняя имеет очень хитрую геометрию и действует на сигнал весьма своеобразно: на низких частотах она усиливает общую энергию сигнала, а на средних и высоких частотах сказываются резонансы ее внутренних полостей, и в сигнале появляется ряд энергетических пиков и провалов. Максимальная неравномерность наблюдается в диапазоне частот 6-16 кГц. Здесь уровень частотных искажений, вносимый ушной раковиной, максимальный, причем форма этих пиков и провалов сильно зависит от того, на какой высоте находится источник звука, что и является основополагающим признаком того или иного расположения источника звука по высоте.

    Глубинная локализация
    Это психоакустическое явление пока еще мало изучено. Способность слуховой системы определять расстояние до кажущегося источника звука (КИЗ) выражена заметно слабее, чем умение оценивать направление на источник звука, о чем свидетельствуют как многочисленные опыты, так и ежедневная практика. Существует гипотеза, что в основе глубинной локализации лежит слуховая память, то есть при определении расстояния мозг сравнивает известное ощущение громкости с вновь испытанным. Так, например, если человек хорошо знаком со звуковым сигналом (допустим, с гудком клаксона), то расстояние до кажущегося источника чаще всего совпадет с реальным. Для незнакомых звуков оценка расстояния до источника становится весьма грубой, и подчас погрешность составляет до 50%.
    При больших расстояниях, когда источник звука удален от слушателя на десятки метров, хорошим подспорьем для глубинной локализации служит быстрое затухание высокочастотных звуков. Последнее приводит к заметному „потускнению" тембра, что и выявляется слухом, а впоследствии соответствующим образом отражается на определяемом положении КИЗ.
    Однако тембральные изменения — это скорее второстепенный признак, а основой для определения расстояния до источника звука служит интенсивность приходящего звука. Ведь ни для кого не секрет, что звуковое давление, особенно на низких частотах, уменьшается на 6 дБ при каждом удвоении расстояния. Тем не менее нашему мозгу неведома теория — у него свое „субъективное" мнение на этот счет: ощущение удвоения расстояния до звукового объекта у слушателя возникает только при уменьшении звукового давления не на б, как в теории, а на 20 дБ.
    Как ни парадоксально, но при такой огромной погрешности точность глубинной локализации значительно повышается в закрытом реверберирующем пространстве, где имеют место многократные отражения звука. Примером может послужить любой концертный зал, в котором слушатель легко определяет расположение инструментов по глубине. По всей видимости, здесь не последнюю роль играют такие дополнительные признаки, как соотношение энергии прямого и отраженного звука, а также временная разность прихода основного и отраженного звуков. Скорее всего, они заметно улучшают точность глубинной локализации.
    Теперь, получив представление о механизмах локализации звуковых образов, рассмотрим особенности образования КИЗ при стереовоспроизведении.

    Локализация КИЗ при стереовоспроизведении
    Для начала предположим, что слушатель находится в идеальной точке прослушивания— на равном расстоянии от каждого из громкоговорителей. Отличия между сигналами стереопары отсутствуют, — скажем, на каждый динамик подается абсолютно одинаковая по фазе и амплитуде запись женского голоса, а громкоговорители включены синфазно. До тех пор, пока сигналы в правом и левом каналах стереопары совпадают, звучание громкоговорителей сливается в единый звуковой образ певицы, который располагаться точно посередине между динамиками. По мере снижения корреляции (взаимосвязи) между стереоканалами локализация КИЗ будет ухудшаться. При уменьшении корреляции ниже определенного порогового уровня — например, когда сигнал одного канала все еще содержит запись женского вокала, а тем временем во втором канале уже вовсю звучит мужской вокал, — КИЗ разделится на два независимых источника звука, которые будут восприниматься по отдельности в позициях правого и левого громкоговорителей.
    Из вышесказанного ясно, что положение КИЗ в пространстве воображаемой звуковой сцены в первую очередь зависит от свойств самого звукового сигнала, и в частности, от степени корреляции между стереоканалами, определяемой исключительно временными и интенсивностными различиями сигналов, достигающих ушей слушателей. Эти различия, как уже упоминалось, могут быть обусловлены либо свойствами самих звуковых сигналов левого и правого каналов, либо позицией слушателя относительно громкоговорителей.
    О втором факторе, как наиболее интересном и актуальном, мы поговорим чуть позже — оставим, так сказать, на десерт, — а пока познакомимся с первым, когда положение слушателя строго симметрично относительно громкоговорителей, а на положение КИЗ могут повлиять только интенсивностью и временные отличия, заложенные в самом стереосигнале.
    Влияние интенсивностных различий Посмотрите на рис. 3. Тут все проще простого: увеличение интенсивности сигнала одного из каналов сопровождается перемещением КИЗ от его первоначального положения в сторону динамика, излучающего сигнал с большим уровнем. Характер этой зависимости для всех музыкальных сигналов одинаков, он показан на рис. 3


    Влияние временных различий
    При введении временного сдвига КИЗ смещается в сторону громкоговорителя, излучающего опережающий сигнал. Ситуация внешне напоминает случай с интенсивностными различиями, но далеко не всегда. Перемещение КИЗ с увеличением временного сдвига носит монотонный характер только для сигналов с однородным спектром, таких как арфа, рояль, труба и др. Если обратить внимание на рис. 5, то можно заметить, что с увеличением временного сдвига до 1 мс наблюдается очень быстрое перемещение КИЗ. В дальнейшем, при временном сдвиге, превышающем 1 мс, КИЗ „не торопясь", равномерно перемещается в сторону громкоговорителя, излучающего опережающий сигнал.


    Для звуковых сигналов с неоднородным спектром, например, для записей скрипок, женского вокала или флейты, зависимость местоположения КИЗ от временного сдвига носит ярко выраженный индивидуальный характер, хотя коечто общее все же имеется. Как и в случае с сигналами однородного спектра, при небольших временных сдвигах (до 0,5 мс) перемещение КИЗ равномерное и предсказуемое. Когда же временной сдвиг составляет от 0,5 до 7 мс положение КИЗ изменяется хаотично. В этом интервале наблюдается неоднократное образование КИЗ в одной и той же точке пространства при разных временных сдвигах. При увеличении временного сдвига свыше 7 мс, „блуждания" звукового образа становятся все меньшими по амплитуде, а вскоре и совсем исчезают. КИЗ локализуется в позиции громкоговорителя, излучающего опережающий сигнал (см. рис. 5).

    Интенсивностные и временные различия
    Получив наглядное представление о влиянии интенсивностных и временных отличий по отдельности, оценим их совместное влияние. Как уже многие поняли, в этом случае оценка направления на КИЗ определяется одновременным, но независимым действием на орган слуха временных и интенсивностных различий в сигналах стереопары. В некоторых случаях возможна компенсация одной разности другой.
    Исследования акустиков показывают, что компенсация временного сдвига интенсивно-стной разницей возможна до тех пор, пока временной сдвиг не превышает определенное пороговое значение (Δτпор), которое для разных музыкальных инструментов и иных типов звукового сигнала несколько отличается. Пороговое значение, при котором наступает распад КИЗ на два действительных источника звука, зависит от структуры звукового сигнала, что хорошо видно из сводной табл. 2.

    Таблица 2. Значения порогового значения временной разности для разных музыкальных инструментов


    Вид звукового сигнала
    Δτпор
    Женский вокал 8
    Скрипка 11
    Альт 12
    Мужской вокал 6
    Малый барабан 4
    Большой барабан 6
    Рояль 15
    Виолончель 25

    Среднестатистическое значение порогового временного сдвига обычно составляет 5-6 мс, именно в этой области еще возможна компенсация временной разницы интенсивностной. Вместе с тем экспериментально полученная кривая зависимости интенсивного и временного факторов имеет довольно сложный и неоднозначный характер, о чем лучше всяких слов свидетельствует приводимый рис. 6, так что говорить о компенсации можно лишь с большими оговорками.
    Теперь, зная, каково влияние временных и интенсивностных отличий на положение КИЗ, можно перейти к рассмотрению наиболее интересного для автомобильной аудиосистемы случая — ассимметричного положения слушателя относительно громкоговорителей.


    Асимметричное положение слушателя


    При боковом смещении слушателя, например, при прослушивании аудиосистемы с водительского места (рис. 7), появляются дополнительные (кроме отличий в самом звуковом сигнале) интенсивностные и временные различия в сигналах, поступающих от громкоговорителей в точку прослушивания, обусловленные боковым смещением. В простейшем случае, их величина зависит от расстояния, проходимого звуковой волной от правого и левого динамиков к правому и левому уху слушателя (L1 и L2 соответственно), и от диаграммы направленности динамиков, в частности, от коэффициента направленности D(ω) при углах излучения ω1 и ω2. Ниже приведены формулы для расчета интенсивностной и временной разностей:

    ΔN=20lg((L2D2(ω2))/(L2D2((ω1 ))
    Δτ=(L2-L1)/c, где с=341 м/с— скорость распространения звуковых волн.

    Зная расстояние от ушей слушателя до динамиков (возьмем L1=1м, L2=1,4м), а также приняв, простоты ради, что коэффициент направленности при разных углах излучения у двух динамиков одинаков, нетрудно оценить величину интенсивностных и временных разностей, порождаемых несимметричным положением слушателя: временная разность составит примерно 1,2 мс, а интенсивностная — около 3 дБ.
    Однако полученные значения — это уже детали, смысл же явления состоит в том, что оба фактора — временной и интенсивностный — действуя вместе, вызывают смещение КИЗ в сторону ближнего к слушателю динамика, то есть в нашем случае к громкоговорителю Гр1. При этом основную роль в перемещении КИЗ играет временная разность).
    Возвращению звукового образа на его законное место сможет способствовать введение дополнительной компенсирующей интенсивностной разницы (ΔN). Ее величина зависит от множества факторов: бокового смещения слушателя, расстояния от него до динамиков, базы громкоговорителей и т. п., а для нашего примера составляет около 4 дБ (см. рис. 8).


    В иных случаях она может быть как большей, так и меньшей, но не стоит воспринимать такое решение как панацею. Введение компенсирующей разницы величиной даже в 3 дБ самым негативным образом сказывается на восприятии музыки, ибо звучание одного из стереоканалов в два раза громче другого. До сих пор мы рассматривали влияние бокового смещения слушателя на одиночный звуковой образ, однако все вышесказанное справедливо и для нескольких КИЗ, образующих звуковую сцену. Наглядное представление о характере изменений в звуковой сцене под влиянием интенсивностных и временных разностей можно получить из рис. 9.

    На нем по горизонтали между двумя динамиками условно показано пять звуковых образов, составляющих стереокартину. При нулевом боковом смещении слушателя, то есть когда последний располагается на оси симметрии между динамиками, образы равномерно распределены по периметру воображаемой сцены. В следующем „сечении" — при боковом смещении слушателя на расстояние приблизительно 0,2 м — картина менее радужная. Обратите внимание: если ситуация с крайним правым КИЗ еще более-менее приемлемая, то положение всех остальных образов претерпело очень серьезные изменения, и уже не укладывается в условно-приемлемые рамки. Еще более серьезные изменения звуковая сцена претерпевает, когда боковое смещение слушателя достигает 0,4 м. Такое смещение типично для большинства водительских мест, поэтому мы неспроста заостряем на нем внимание наших читателей. В этом случае большинство КИЗ локализуется в позиции первого громкоговорителя, и только крайне правый образ занимает близкое к исходному положение. Ясно, что звуковая сцена с таким расположением звуковых образов создает отнюдь не радостную картину, да и вообще — говорить о звуковой сцене в такой ситуации можно лишь с большой натяжкой.
    Итак, рассказав о многих аспектах локализации звуковых образов, мы наконец-то затронули главную проблему автомобиля, и в частности, водительского сиденья как места для прослушивания, а именно— асимметричное положение слушателя относительно громкоговорителей. Многие уже поняли: именно эта асимметрия и вызывает столь значительные изменения в местоположении звуковых образов по сравнению с изначальным. Одним словом, проблема, причем весьма и весьма серьезная. Имеющимся в распоряжении каждого владельца магнитолы регулятором баланса ее не устранить (хотя предназначен он вроде бы именно для этого). О том, как с ней борются на практике специалисты из лучших инсталляционных центров, мы постараемся рассказать в одном из последующих номеров журнала.

    Для кого-то правильная локализация кажущихся источников звука — это всего лишь очередной аспект высококачественного звуковоспроизведения, а для кого-то —жизненно важная необходимость, помогающая выжить в сложном мире. Хороший пример тому — совы, ночные охотники. Многочисленные исследования показали, что при поиске жертвы они руководствуются исключительно слуховыми ощущениями, а зрительное восприятие для них второстепенно. Острота слуха у многих сов просто поразительна, и лабораторные опыты неоднократно подтверждали это. Из всех опытов отметим только наиболее интересный: в комнату, где под настилом из опилок находилось несколько небольших динамиков, помещали сову и выключали освещение. Чтобы оценить реакцию птицы на один из динамиков, внезапно подали сигнал, содержащий запись мышиного писка, и... спустя секунду динамик оказался абсолютно непригодным для эксплуатации...

    Источник: журнал Car&Music. Текст Алексей Крупчан, иллюстрации Владислав Максименко
  • Предложения партнеров МАГНИТОЛЫ

  cc by-nc-sa