OB 小林 亙
D3 岡田雅司

組み込みシステム向け立体音像定位手法に関する研究

音像定位

ある音源に対して、人間の知覚する音の空間的な像を音像と呼びます。
一般に、ある場所から放出される音は、壁・床等の部屋の構造や媒体などによる反射・回折・散乱の影響や、人間の頭部や耳介の影響を受けて両耳鼓膜上に到達し、人間は聴覚器官を介することにより、これを音として知覚します。
このように、音が伝達することで音の方向や距離などの空間的な情報を得ることができ、音像の位置を判断する事象を音像定位と呼んでいます。

soundimage.png

音像定位の物理的な要因や特徴を解明し、音像定位を制御することができれば、 2チャネルスピーカやヘッドホンを用いる一般の音響機器上で、より臨場感ある音場を再現することができます。

頭部伝達関数

ある位置で何らかの要因により発生した音は、固体内や空気中を伝わって人間の耳に到達するため、音源の元々保有している特性だけでなく、伝播した媒体の特性や伝播経路の情報も含まれます。
これらの情報のうち、聴取者の胴、頭部、耳介などによる影響を周波数に対する振幅や位相の特性で表現したものを頭部伝達関数と呼びます。
すなわち、頭部伝達関数は、音源から聴取者の鼓膜までの音の伝達特性を表す関数です。

hrtf.png

この頭部伝達関数を測定し、再現することができれば、より臨場感ある音場を実現することができます。

頭部伝達関数の測定

頭部伝達関数の測定手法として、人間の外耳道内に超小型のマイクを挿入して録音する手法もありますが、これは、人体から生じる雑音の影響が大きく、また、測定時に多大な負荷がかかるという問題があります。

そこで、HATS(HATS: Head and Torso Simulator)あるいはダミーヘッドと呼ばれる、人間の頭部および胴体を模した人形にマイクを取り付けたものを用いて頭部伝達関数を測定する手法があります。

本研究室では、 Bruel & Kjaer 社の Type4100D という HATS を所有しています(下図)。

 left,nolink
hats2.jpg

また、頭部伝達関数の測定作業は、無響室と呼ばれる、音の反射を最小限に抑え、何もない自由空間を擬似的に再現する特殊な部屋で行われます。

anechoic.jpg

本学内には、言語文化研究科および産業科学研究所内に無響室があり、いずれかを借りて測定作業を行います(上図は言語文化研究科のもの)。

立体音像定位手法

ディジタル信号処理技術を用いて、計算機上で頭部伝達関数を再現することで、ヘッドホンや2チャネルスピーカを用いて立体音響効果を得る手法を、立体音像定位手法と呼びます。

localization.png

本研究でのアプローチとして、下図に示すような複雑な頭部伝達関数を、その周波数特性の形状に着目することで簡単化し、演算量を減らすことで、リアルタイム処理が可能なアルゴリズムの開発、ならびにその実装を行っています。

proposed.png

立体音像定位手法の機能拡張

静止音に対する立体音像定位手法が確立される一方で、立体音像定位手法に対して、以下のような機能拡張が求められています。

移動音源への対応

立体音像定位手法の様々な分野への応用を考える場合、ユーザからの入力に応じて、 3次元空間上のあらゆる位置を自由に動き回るような音源の再現が求められます。
しかしながら、頭部伝達関数は音源の位置に依存して変化し、 3次元空間上のあらゆる位置における頭部伝達関数を再現するためには、膨大なデータが必要になります。
そこで、本研究では、頭部伝達関数の特徴解析に基づき、効率的なデータ格納方式および補間方式を提案し、任意位置における音像移動を実現しました。

movement.jpg

誇張

立体音響の効果に対する要求は応用分野ごとに異なっており、例えば、聴覚ディスプレイなどの応用例では音像の定位位置の正確さが重要とされます。
これに対して、ゲームなどのエンタテインメント分野においては、正確な立体音響よりも、移動感が明確に感じられるなど、誇張された立体音響が要求される傾向にあります。
そこで、本研究では、分野ごとの要求に応じて容易に立体音響の誇張度を調整する手法について研究を行っています。

その一例として、人間が耳を澄ます際に耳に手を当てる様子から着想を得て、耳介の大きさを誇張し、より迫力のある音像移動を実現する方法を提案しています。

exaggerate.jpg

距離に関する定位感の向上

一般に、距離方向に関する音像定位の実現は、水平角・仰角方向と比べて困難です。
これは距離の変化に対する頭部伝達関数の変化が極めて小さいためであり、距離感の再現には、頭部伝達関数を忠実に再現するだけでなく、部屋の反響などの聴取環境や、音源の大きさの影響やドップラー効果などの音源の状態に起因する音響効果の再現が必要となります。
そこで、これらの音響効果を低演算量で実現する手法に関して研究を行っています。

distance.jpg

多数の音源への対応

多数の音源に対して立体音像定位処理を施す場合、単純な実装方法では、音源の数に比例した演算量が必要になります。

しかしながら、人間の聴覚には、近接する2つの音の位置を混同するなどといった特徴があり、このような特徴を考慮することで、演算量の削減が可能となります。
そこで、このような人間の聴覚上の特性を利用し、音源のクラスタリングに基づき、多音源に対する立体音像定位手法を提案しています。

multiple.png

三次元音場生成

頭部伝達関数は環境がもたらす反射や拡散などの影響を除外した無響室で測定されます。
このような頭部伝達関数は聴取者に仮想音源を知覚させるための十分な情報を与えますが、実環境との食い違いにより臨場感・現実感に欠けるという問題があります。

そこで、我々は環境がもたらす諸物理現象を模擬することで、仮想的な音場を生成する方法について研究しています。
本アプローチではシミュレーションによって得られた反射音の集合を、頭部伝達関数を用いてレンダリングすることにより音場生成を実現しています(下図)。

sound-field_reproduction.png

多数の反射音の音像定位処理に関しては、 上記の多音源に対する立体音像定位手法を利用することで低演算化を目指しています。


Last-modified: 2012-06-04 (月) 15:25:06