Современные методы позиционирования и сжатия звука
Категория реферата: Рефераты по информатике, программированию
Теги реферата: фонды реферат, реферат на тему мова
Добавил(а) на сайт: Куваев.
Предыдущая страница реферата | 18 19 20 21 22 23 24 25 26 27 28 | Следующая страница реферата
Частотная характеристика
Действие HRTF зависит от частоты звука; только звуки со значениями
частотных компонентов в пределах от 3 kHz до 10 kHz могут успешно
интерпретироваться с помощью функций HRTF. Определение местоположения
источников звуков с частотой ниже 1 kHz основывается на определении времени
задержки прибытия разных по фазе сигналов до ушей, что дает возможность
определить только общее расположение слева/справа источников звука и не
помогает пространственному восприятию звучания. Восприятие звука с частотой
выше 10 kHz почти полностью зависит от ушной раковины, поэтому далеко не
каждый слушатель может различать звуки с такой частотой. Определить
местоположение источников звука с частотой от 1 kHz до 3 kHz очень сложно.
Число ошибок при определении местоположения источников звука возрастает при
снижении разницы между соотношениями амплитуд (чем выше пиковое значение
амплитуды звукового сигнала, тем труднее определить местоположение
источника). Это означает, что нужно использовать частоту дискретизации
(которая должна быть вдвое больше значения частоты звука) соответствующей
как минимум 22050 Hz при 16 бит для реальной действенности HRTF.
Дискретизация 8 бит не обеспечивает достаточной разницы амплитуд (всего 256
вместо 65536), а частота 11025 Hz не обеспечивает достаточной частотной
характеристики (так как при этом максимальная частота звука соответствует
5512 Hz). Итак, чтобы применение HRTF было эффективным, необходимо
использовать частоту 22050 Hz при 16 битной дискретизации.
Ушная раковина (Pinna)
Мозг человека анализирует разницу амплитуд, как звука, достигшего внешнего уха, так и разницу амплитуд в слуховом канале после ушной раковины для определения местоположения источника звука. Ушная раковина создает нулевую и пиковую модель звучания между ушами; эта модель совершенно разная в каждом слуховом канале и эта разница между сигналами в ушах представляет собой очень эффективную функциюдля определения, как частоты, так и местоположения источника звука. Но это же явление является причиной того, что с помощью HRTF нельзя создать корректного восприятия звука через колонки, так как по теории ни один из звуков, предназначенный для одного уха не должен быть слышимым вторым ухом.
Мы вновь вернулись к необходимости использования дополнительных
алгоритмов CC. Однако, даже при использовании кодирования звука с помощью
HRTF источники звука являются неподвижными (хотя при этом амплитуда звука
может увеличиваться). Это происходит из-за того, что ушная раковина плохо
воспринимает тыловой звук, т.е. когда источники звука находятся за спиной
слушателя. Определение местоположения источника звука представляет собой
процесс наложения звуковых сигналов с частотой, отфильтрованной головой
слушателя и ушными раковинами на мозг с использованием соответствующих
координат в пространстве. Так как происходит наложение координат только
известных характеристик, т.е. слышимых сигналов, ассоциируемых с визуальным
восприятием местоположения источников звука, то с течением времени мозг
"записывает" координаты источников звука и в дальнейшем определение их
местоположения может происходить лишь на основе слышимых сигналов. Но видим
мы только впереди. Соответственно, мозг не может правильно расположить
координаты источников звука, расположенных за спиной слушателя при
восприятии слышимых сигналов ушной раковиной, так как эта характеристика
является неизвестной. В результате, мозг может располагать координаты
источников звука совсем не там, где они должны быть. Подобную проблему
можно решить только при использовании вспомогательных сигналов, которые бы
помогли мозгу правильно располагать в пространстве координаты источников
звуков, находящихся за спиной слушателя.
Неподвижные источники звука
Все выше сказанное подвело нас к еще одной проблеме:
Если источники звука неподвижны, они не могут быть точно локализованы, как "статические" при моделировании, т.к. мозгу для определения местоположения источника звука необходимо наличие перемещения (либо самого источника звука, либо подсознательных микро перемещений головы слушателя), которое помогает определить расположение источника звука в геометрическом пространстве. Нет никаких оснований, ожидать, что какая-либо система на базе HRTF функций будет корректно воспроизводить звучание, если один из основных сигналов, используемый для определения местоположения источника звука, отсутствует. Врожденной реакцией человека на неожидаемый звук является повернуть голову в его сторону (за счет движения головы мозг получает дополнительную информацию для локализации в пространстве источника звука). Если сигнал от источника звука не содержит особую частоту, влияющую на разницу между фронтальными и тыловыми HRTF функциями, то такого сигнала для мозга просто не существует; вместо него мозг использует данные из памяти и сопоставляет информацию о местоположении известных источников звука в полусферической области.
Каково же будет решение?
Лучший метод воссоздания настоящего 3D звука это использование минимальной частоты дискретизации 22050 Hz при 16 битах и использования дополнительных тыловых колонок при прослушивании. Такая платформа обеспечит пользователю реалистичное воспроизведение звука за счет воспроизведение через достаточное количество колонок (минимум три) для создания настоящего surround звучания. Преимущество такой конфигурации заключается в том, что когда слушатель поворачивает голову для фокусировки на звуке какого-либо объекта, пространственное расположение источников звука остается неизменным по отношению к окружающей среде, т.е. отсутствует проблема sweet spot.
Есть и другой метод, более новый и судить о его эффективности пока
сложно. Суть метода, который разработан Sensaura и называется MultiDrive, заключается в использовании HRTF функций на передней и на тыловой паре
колонок (и даже больше) с применением алгоритмов CC. На самом деле Sensaura
называет свои алгоритмы СС несколько иначе, а именно Transaural Cross-talk
cancellation (TCC), заявляя, что они обеспечивают лучшие низкочастотные
характеристики звука. Инженеры Sensaura взялись за решение проблемы
восприятия звучания от источников звука, которые перемещаются по бокам от
слушателя и по оси фронт/тыл. Заметим, что Sensaura для вычисления HRTF
функций использует так называемое "цифровое ухо" (Digital Ear) и в их
библиотеке уже хранится более 1100 функций. Использование специального
цифрового уха должно обеспечивать более точное кодирование звука.
Подчеркнем, что Sensaura создает технологии, а использует интерфейс DS3D от
Microsoft.
Технология MultiDrive воспроизводит звук с использованием HRTF функций через четыре или более колонок. Каждая пара колонок создает фронтальную и тыловую полусферу соответственно.
Фронтальные и тыловые звуковые поля специальным образом смещены с целью взаимного дополнения друг друга и за счет применения специальных алгоритмов улучшает ощущения фронтального/тылового расположения источников звука. В каждом звуковом поле применяются собственный алгоритм cross-talk cancellation (CC). Исходя из этого, есть все основания предполагать, что вокруг слушателя будет плавное воспроизведение звука от динамично перемещающихся источников и эффективное расположение тыловых виртуальных источников звука. Так как воспроизводимые звуковые поля основаны на применении HRTF функций, каждое из создаваемых sweet spot (мест, с наилучшим восприятием звучания) способствует хорошему восприятию звучания от источников по сторонам от слушателя, а также от движущихся источников по оси фронт/тыл. Благодаря большому углу перекрытия результирующее место с наилучшим восприятием звука (sweet spot) покрывает область с гораздо большей площадью, чем конкурирующие четырех колоночные системы воспроизведения. В результате качество воспроизводимого 3D звука должно существенно повысится.
Если бы не применялись алгоритмы cross-talk cancellation (CC) никакого позиционирования источников звука не происходило бы. Вследствие использования HRTF функций на четырех колонках для технологии MultiDrive необходимо использовать алгоритмы CC для четырех колонок, требующие чудовищных вычислительных ресурсов. Из-за того, что обеспечить работу алгоритмов CC на всех частотах очень сложная задача, в некоторых системах применяются высокочастотные фильтры, которые срезают компоненты высокой частоты. В случае с технологией MultiDrive Sensaura заявляет, что они применяют специальные фильтры собственной разработки, которые позволяют обеспечить позиционирование источников звука, насыщенными высокочастотными компонентами, в тыловой полусфере. Хотя sweet spot должен расшириться и восприятие звука от источников в вертикальной плоскости также улучшается, у такого подхода есть и минусы. Главный минус это необходимость точного позиционирования тыловых колонок относительно фронтальных. В противном случае никакого толка от HRTF на четырех колонках не будет.
Стоит упомянуть и другие инновации Sensaura, а именно технологии ZoomFX
и MacroFX, которые призваны улучшить восприятие трехмерного звука.
Расскажем о них подробнее, тем более что это того стоит.
MacroFX
Как мы уже говорили выше, большинство измерений HRTF производятся в так
называемом дальнем поле (far field), что существенным образом упрощает
вычисления. Но при этом, если источники звука располагаются на расстоянии
до 1 метра от слушателя, т.е. в ближнем поле (near field), тогда функции
HRTF плохо справляются со своей работой. Именно для воспроизведения звука
от источников в ближнем поле с помощью HRTF функций и создана технология
MacroFX. Идея в том, что алгоритмы MacroFX обеспечивают воспроизведение
звуковых эффектов в near-field, в результате можно создать ощущение, что
источник звука расположен очень близко к слушателю, так, будто источник
звука перемещается от колонок вплотную к голове слушателя, вплоть до шепота
внутри уха слушателя. Достигается такой эффект за счет очень точного
моделирования распространения звуковой энергии в трехмерном пространстве
вокруг головы слушателя из всех позиций в пространстве и преобразование
этих данных с помощью высокоэффективного алгоритма. Особое внимание при
моделировании уделяется управлению уровнями громкости и модифицированной
системе расчета задержек по времени при восприятии ушами человека звуковых
волн от одного источника звука (ITD, Interaural Time Delay). Для примера, если источник звука находится примерно посередине между ушами слушателя, то
разница по времени при достижении звуковой волны обоих ушей будет
минимальна, а вот если источник звука сильно смещен вправо, эта разница
будет существенной. Только MacroFX принимает такую разницу во внимание при
расчете акустической модели. MacroFX предусматривает 6 зон, где зона 0 (это
дистанция удаления) и зона 1 (режим удаления) будут работать точно так же, как работает дистанционная модель DS3D. Другие 4 зоны это и есть near field
(ближнее поле), покрывающие левое ухо, правое ухо и пространство внутри
головы слушателя.
Этот алгоритм интегрирован в движок Sensaura и управляется
DirectSound3D, т.е. является прозрачным для разработчиков приложений, которые теперь могут создавать массу новых эффектов. Например, в авиа
симуляторах можно создать эффект, когда пользователь в роли пилота будет
слышать переговоры авиа диспетчеров так, как если бы он слышал эти
переговоры в наушниках. В играх с боевыми действиями может потребоваться
воспроизвести звук пролетающих пуль и ракет очень близко от головы
слушателя. Такие эффекты, как писк комара рядом с ухом теперь вполне
реальны и доступны. Но самое интересное в том, что если у вас установлена
звуковая карта с поддержкой технологии Sensaura и с драйверами, поддерживающими MacroFX, то пользователь получит возможность слышать
эффекты MacroFX даже в уже существующих DirectSound3D играх, разумеется, в
зависимости от игры эффект будет воспроизводиться лучше или хуже. Зато в
игре, созданной с учетом возможности использования MacroFX. Можно добиться
очень впечатляющих эффектов.
Поддержка MacroFX будет включена в драйверы для карт, которые
поддерживают технологию Sensaura.
ZoomFX
Современные системы воспроизведения позиционируемого 3D звука
используют HRTF функции для создания виртуальных источников звука, но эти
синтезированные виртуальные источники звука являются точечными. В реальной
жизни звук зачастую исходит от больших по размеру источников или от
композитных источников, которые могут состоять из нескольких индивидуальных
генераторов звука. Большие по размерам и композитные источники звука
позволяют использовать более реалистичные звуковые эффекты, по сравнению с
возможностями точечных источников звука. Так, точечный источник звука
хорошо применим при моделировании звука от большого объекта удаленного на
большое расстояние (например, движущийся поезд). Но в реальной жизни, как
только поезд приближается к слушателю, он перестает быть точечным
источником звука. Однако в модели DS3D поезд все равно представляется, как
точечный источник звука, а значит, страдает реализм воспроизводимого звука
(т.е. мы слышим звук скорее от маленького поезда, нежели от огромного
состава громыхающего рядом). Технология ZoomFX решает эту проблему, а также
вносит представление о большом объекте, например поезде как собрание
нескольких источников звука (композитный источник, состоящий из шума колес, шума двигателя, шума сцепок вагонов и т.д.).
Для технологии ZoomFX будет создано расширение для DirectSound3D, подобно EAX, с помощью которого разработчики игр смогут воспроизводить новые звуковые эффекты и использовать такой параметр источника звука, как размер. Пока эта технология находится на стадии завершения.
Компания Creative реализовала аналогичный подход, как в MultiDrive от
Sensaura, в своей технологии CMSS (Creative Multispeaker Surround Sound)
для серии своих карт SB Live!. Поддержка этой версии технологии CMSS, с
реализацией HRTF и CC на четырех колонках, встроена в программу обновления
LiveWare 2.x. По своей сути, технология CMSS является близнецом MultiDrive, хотя на уровне алгоритмов CC и библиотек HRTF наверняка есть отличия.
Главный недостаток CMSS такой же, как у MultiDrive - необходимость
расположения тыловых колонок в строго определенном месте, а точнее
параллельно фронтальным колонкам. В результате возникает ограничение, которое может не устроить многих пользователей. Не секрет, что место для
фронтальных колонок давно зарезервировано около монитора. Место для
сабвуфера можно выбрать любым, обычно это где-то в углу и на полу. А вот
тыловые колонки пользователи располагают там, где считают удобным для себя.
Не каждый захочет расположить их строго за спиной и далеко не у всех есть
свободное место для такого расположения.
Заметим, что главный конкурент Creative на рынке 3D звука, компания
Aureal, использует технику панорамирования на тыловых колонках. Объясняется
это именно отсутствием строгих ограничений на расположение тыловых колонок
в пространстве.
Не стоит забывать и о больших объемах вычислений при расчете HRTF и
Cross-talk Cancellation для четырех колонок
Еще один игрок на рынке 3D звука - компания QSound пока имеет сильные позиции только в области воспроизведения звука через наушники и две колонки. При этом свои алгоритмы для воспроизведения 3D звука через две колонки и наушники (в основе лежат HRTF) QSound создает исходя из результатов тестирования при прослушивании реальными людьми, т.е. не довольствуется математикой, а делает упор на восприятие звука конкретными людьми. И таких прослушиваний было проведено более 550000! Для воспроизведения звука через четыре колонки QSound использует панорамирование, т.е. тоже, что было в первой версии CMSS. Такая техника плохо показала себя в играх, обеспечивая слабое позиционирование источников звука в вертикальной плоскости.
Компания Aureal привнесла в технологии воспроизведения 3D звука свою технику Wavetracing. Мы уже писали об этой технологии, вкратце, это расчет распространения отраженных и прошедших через препятствия звуковых волн на основе геометрии среды. При этом обеспечивается полный динамизм восприятия звука, т.е. полная интерактивность.
Итак, подведем итоги. Однозначный вывод состоит в том, что если вы
хотите получить наилучшее качество 3D звука, доступное на сегодняшний день, вам придется использовать звуковые карты, поддерживающие воспроизведение
минимум через четыре колонки. Использование только двух фронтальных колонок
- это конфигурация вчерашнего дня. Далее, если вы только собираетесь
переходить на карты с поддержкой четырех и более колонок, то перед вами
встает классическая проблема выбора. Как всегда единственная рекомендация
состоит в том, чтобы вы основывали свой выбор на собственных ощущениях.
Послушайте максимально возможно число разных систем и сделайте именно свой
выбор.
Теперь посмотрим, с каким багажом подошли ведущие игроки 3D звукового
рынка к сегодняшнему дню и что нас ждет в ближайшем будущем.
EAR
EAR - в текущей версии IAS 1.0 реализована поддержка воспроизведения
DS3D, A3D 1.0 и EAX 1.0 через четыре и более колонок. За счет
воспроизведения через четыре и более колонок, мозг слушателя получает
дополнительные сигналы для правильного определения местоположения
источников звука в пространстве.
Осенью ожидается выход IAS 2.0 с поддержкой DirectMusic, YellowBook,
EAX 2.0
и A3D 2.0, force-feed back (мы сможем чувствовать звук, а именно давление
звука, громкость и т.д.), декодирование в реальном времени MP3 и Dolby/DTS, будет реализована поддержка ".1" канала (сабвуфера). Кроме того, в IAS 2.0
будет реализовано звуковое решение, не требующее наличие звуковой карты
(cardless audio solution) для использования с полностью цифровой системой
воспроизведения звука, например с USB колонками или в тандеме с домашней
системой Dolby Digital.
Главные достоинства IAS от EAR:
Один интерфейс для любой многоколоночной платформы, обеспечивающий
одинаковый результат вне зависимости от того, как воспроизводится звук при
использовании специального API.
Имеется поддержка воспроизведения через две колонки (для старых систем),
если многоколоночная конфигурация недоступна.
Пользователь может подключить свой компьютер к домашней звуковой системе
(Dolby Digital и т.д.) и IAS будет воспроизводить звук без необходимости
какой-либо модернизации.
Итак, по сравнению с конкурентами, IAS работает на любой платформе и не
требует специального аппаратного обеспечения. При этом IAS использует любое
доступное аппаратное обеспечение и обеспечивает пользователю наилучшее
качество звука, которое доступно на его системе. Только вот остановит ли
свой выбор пользователь на этой технологии, это большой вопрос. С другой
стороны, для использования IAS не нужно покупать специальных звуковых карт.
Sensaura
Sensaura - компания занимающаяся созданием технологий. Производители
звуковых чипов лицензируют разработки Sensaura и воплощают их в жизнь. В
чипе Canyon3D от ESS будет реализована поддержка современных технологий
Sensaura, которые должны обеспечить слушателем 3D звук на современном
уровне, т.е. позиционируемый в пространстве и с воспроизведением через
четыре и более колонок. За воспроизведение через четыре и более колонок
отвечает технология MultiDrive, которая реализует HRTF и алгоритмы Cross-
talk cancellation. Многообещающе выглядят технологии ZoomFX и MacroFX.
Кроме того, Sensaura поддерживает воспроизведение реверберации через EAX от
Creative, равно как и через I3DL2, а также эмулирует поддержку A3D 1.х
через DS3D.
Первым звуковым чипов, который реализует технологию MultiDrive на практике, является Canyon3D от ESS Technology, Inc. Более подробную информацию о чипе Canyon3D можно найти на официальном сайте www.canyon3d.com.
Первая карта на базе чипа Canyon3D называется DMX и производит ее компания Terratec.
Как только эта карта попадет к нам на испытания, мы представим на ваш
суд обзор. Заметим только, что на этой карте будут сразу оба типа цифровых
выходов S/PDIF коаксиальный (RCA) и оптический (Toslink), и один цифровой
вход. Так что продукт обещает быть очень интересным.
Creative
Creative - занимается совершенствованием своего движка реверберации. В
итоге в свет выйдет EAX 3.0, который должен добавить больше реализма в
воспроизводимый звук. Никто не спорит, что реверберация это хорошо, что
именно она обеспечивает насыщенное и живое звучание. При этом Creative
упорно не собирается вести разработки в области геометрии акустики. Кстати,
Microsoft объявила о намерении включить EAX в состав DirectSound3D 8.0. С
другой стороны, есть неподтвержденные слухи, что EAX 3.0 будет закрытым
стандартом. Интересно, изменит ли Creative свою позицию со временем? Пока
же в новых версиях EAX нам обещают больше реализма и гибкости в настройках
реверберации и моделировании звуковой среды для конкретных объектов и
помещений, плюс плавные переходы от одной заранее созданной звуковой среды
к другой при движении слушателя в 3D мире. Будут улучшения в области
воспроизведения эффектов окклюзии и обструкции. Обещают и поддержку
отраженных звуков, но без учета геометрии и более продвинутую дистанционную
модель. Вообще, я не удивлюсь, если Creative лицензирует MacroFX и ZoomFX у
Sensaura. Что касается моделирования звука на основе физической геометрии
среды, то Creative очень усиленно отрицает для себя возможность поддержки
такого метода. Хотя, если поднять архивы и посмотреть первый пресс-релиз о
будущем чипе Emu10k1, то вы будете удивлены. Там говорится именно об
использовании физической геометрии среды при моделировании звука. Потом
планы изменились. Кто помешает Creative вновь изменить планы? Особенно если
учесть появление в ближайшее время движка реверберации от Aureal. Вряд ли
Creative не сделает ответного хода.
QSound
QSound ведет работы по созданию новой технологии воспроизведения 3D
звука через четыре и более колонок. Зная пристрастия QSound, можно
предположить, что в основу новой технологии опять лягут результаты реальных
прослушиваний. QSound, как и Sensaura занимается именно технологиями, которые воплощают в виде чипов другие компании. Так, чип Thunderbird128 от
VLSI воплощает в себе все последние достижения QSound в области 3D звука, при этом Thunderbird128 это DSP, а значит, есть все основания ожидать
последующей модернизации. Стоит упомянуть, что QSound, подобно Creative
считает, что главное в 3D звуке это восприятие слушателем окружающей
атмосферы игры. Поэтому QEM (QSound Environmental Modeling) совместима с
EAX 1.0 от Creative. Следует ожидать, что QEM 2.0 будет совместима с EAX
2.0. Отметим, что QSound славится очень эффективными алгоритмами и
грамотным распределением доступных ресурсов, неслучайно именно их менеджер
ресурсов был лицензирован Microsoft и включен в DirectX.
Aureal
С Aureal все более-менее понятно. В ближайшем будущем нам обещают дальнейшее улучшение функциональности A3D, мощный движок реверберации, поддержку HRTF на четырех и более колонках.
Мы упомянули основные разработки в области 3D звука, которые применяются в компьютерном мире. Есть еще ряд фирм с интересными решениями, но они делают упор на рынок бытовой электроники, поэтому в данном материале yt рассказывается о них.
Обзорно изучив технологии, существующие на рынке позиционирования 3Д звука, попробуем рассмотреть их более пристально.
В видении компании Sensaura
Компания Sensaura более 10 лет занимается созданием звуковых
технологий. Все разработки Sensaura ориентированы на работу через
стандартный интерфейс DirectSound3D и его расширения. Часть технологий
Sensaura уже применяются на практике, другие разработки мы скоро увидим в
действие. По сути, Sensaura предлагает использовать производителям звуковых
чипов и карт специальные алгоритмы, которые в паре со стандартным API DS3D
и расширениями для него, должны обеспечить моделирование и воспроизведение
качественного 3D звука.
Попробуем рассказать о том, что же предлагает Sensaura.
Digital Ear
Для корректного воспроизведения 3D звука через наушники или колонки
необходимо использовать специальные алгоритмы, базирующиеся на
использовании HRTF функций. Кроме того, при воспроизведении 3D звука через
колонки необходимо использовать дополнительные алгоритмы Cross-talk
Cancellation, вариант которых от Sensaura носит имя Transaural Cross-talk
Cancellation (TCC).
Инженеры Sensaura пришли к выводу, что использование для формирования
библиотек HRTF измерения, сделанные с помощью специального манекена или с
приглашением реальных слушателей не могут обеспечить удовлетворить
абсолютно всех слушателей. Дело в том, что какое бы большое число измерений
не было сделано с использованием манекена, все полученные HRTF все равно
будут усредненными. Все то же самое относится и к измерениям, сделанным с
приглашением большого числа различных слушателей. Все равно есть небольшая
часть людей, у которых совершенно отличные параметры слуха, а значит, при
измерении у них получаются, совсем другие HRTF функции. В результате, какой
бы большой и универсальной не была библиотека HRTF функций, часть людей не
услышат ожидаемого 3D звука. Чтобы решить эту проблему, специалисты
Sensaura разработали технологию Digital Ear (Цифровое ухо), ранее
называвшуюся Virtual Ear. Суть идеи Digital Ear в том, что для измерения
HRTF используется не просто манекен или приглашаются реальные слушатели, а
используется чисто математический метод Ключевым элементом этого метода
является математическая модель человеческого уха с изменяемыми параметрами.
В основу математической модели положена концепция того, что сложные
резонансные и дифракционные эффекты, являющиеся неотъемлемой частью любой
HRTF функции могут независимо изменяться. В результате созданая дуплексная
система, позволяющая изменять различные параметры в произвольном масштабе.
Прежде чем была построена эта математическая модель было проведено масса
исследований с целью точно смоделировать само ухо, точно определить, как
оно реагирует на звуковые волны и как работает процесс человеческого слуха.
Учитывались особенности восприятия мозгом различных звуков от источников, расположенных в разных точках пространства. Затем была создана модель уха
из специального пластика, на нем были проведены измерения и отлажена
математическая модель. Потом были получены базовые результаты измерения
HRTF, на основе которых в дальнейшем с помощью специальных методов
масштабирования стала формироваться библиотека HRTF. Использование
математической модели гарантирует от наличия ошибок, которые возможны при
физическом измерении HRTF с помощью манекена или реальных слушателей.
Digital Ear можно настроить на огромное количество вариаций форм и размеров
ушей реальных людей. В итоге получается обширная библиотека с возможностью
очень гибко выбрать одну или несколько HRTF, которая наилучшим образом
соответствует особенностям каждого конкретного слушателя. Кроме того, так
как используется математическая модель, имеется возможность довольно
простой модернизации алгоритмов и обновления библиотек HRTF без больших
материальных затрат.
Между некоторыми параметрами Digital Ear существует зависимость, не
мешающая масштабированию каждого из параметров в отдельности. Это позволяет
построить простой интерфейс пользователя, позволяющий путем определения и
задания в качестве данных некоторых физических параметров, описывающих
голову и уши слушателя выбрать именно те HRTF функции из библиотеки, которые наилучшим образом отвечают особенностям конкретного слушателя. Вот
эти параметры:
Размер головы (Head Size) - влияет на изменение величины ITD (Interaural
time delay) задержки по времени при восприятии ушами слушателя звука от
одного источника
Размер уха (Ear Size) - влияет на протяженность звукового спектра
Глубина ушной раковины (Concha Depth) - влияет на величину сдвига звукового
спектра
Тип ушной раковины (Concha Type) - влияет на величину амплитуды звукового
сигнала
Слева неглубокая ушная раковина, справа – глубокая
Слева ушная раковина открытого типа, справа - закрытого типа
В результате, каждый пользователь сможет настроить воспроизведения 3D звука с использованием технологии Digital Ear специально под себя. Пока технология Digital Ear не позволяет использовать гибкую настройку под конкретного слушателя и во всех дравейрах к звуковым картам, использующим технологии Sensaura задействуется универсальный набор HRTF функций, соответствующий среднему слушателю. Однако обещается, что уже в скором времени у пользователя появится возможность выбора HRTF под себя.
Рекомендуем скачать другие рефераты по теме: сочинение на тему зима, текст для изложения.
Предыдущая страница реферата | 18 19 20 21 22 23 24 25 26 27 28 | Следующая страница реферата