骨伝導: リンクが欠如している?

録音した自分の声を聞くと、他人には自分に聞こえる声とは別の声が聞こえているのだと感じることがあります。これは主に他の人には聞こえない骨伝導音と共に自分の声を聞いている為です。

ベーシックス

骨伝導音は構造伝搬音です。つまり固体を伝わる音です。骨伝導の場合この固体は骨です。自分以外の人に聞こえる自分の声は空気伝搬音、つまり空気を伝わる音です。

即ち骨伝導とは、私たちの声のうち、声帯から骨を伝わって直接内耳に届く音であり、空気中を伝わって外耳、鼓膜、中耳、蝸牛へと伝わる空気伝搬音とは異なります。

Transverse wave

Pajs, Public domain,
via Wikimedia Commons

Longitudinal wave

Pajs, Public domain,
via Wikimedia Commons

これら 2 種類の音の基本的な違いは、空気中を伝搬するのは波の振動方向に平行である縦波のみであるのに対して、構造体を伝搬するのは縦波だけでなく波の振動方向に垂直である横波も含まれるということです。この 2 種類の波の所謂カップリングが面状や棒状のコンポーネンツに発生するとき、曲げ変形の原因となる曲げ波が生ずることがあります。

音のエネルギーが大きい為、曲げ波は空気伝搬音を発生させます。コンデンサスピーカーやプレーナ型スピーカーのメンブレーンやベル(面状)やトライアングル(棒状)を想像してください。歌手や合唱団の指揮者は演奏を始める前に正確なピッチを得る為に音叉を上あごやこめかみに当てて骨伝導を利用します。そうすれば騒音環境でも音叉の弱い音を聴きとることが可能になります。

構造伝搬音における音の伝搬速度は媒体の特性、とりわけ密度、 弾性、横収縮係数、弾性率 (縦波)、剛性率 (横波)に大きく依存します。

インプリメンテーションが不十分?

普通のヘッドセットは骨伝導を考慮に入れていない為、ハンズフリーで発話する際はマイクで話者の空気伝搬音を拾うだけです。そして残念なことに通りの騒音、風や雨の音、そしてとりわけ自分以外の人が話す声といった周囲の環境音までも拾ってしまいます。特に、ノイズが気になる環境において、骨伝導はインイヤー型のヘッドセットにおけるハンズフリーの音質を向上させるポテンシャルで溢れています。製造メーカーはこのポテンシャルを活かし、特別な圧電マイクロホン (骨伝導センサー) を用いてこのポテンシャルを活かそうとしますが、これまで骨伝導を考慮に入れてこなかった為製品の最適化ができないか、或いは非標準的なテストを用いた為信頼性に乏しいテスト結果しか得られず、多くは徒労に終わるケースが多くみられました。

包括的テスト

そこに HEAD acoustics のお役立ちの場があります。私たちは骨伝導センサーを用いたヘッドセットの包括的テストを可能にします。その為には弊社のアーティフィシャルヘッド  HMS II.3 LN HEC の ViBRIDGE バージョンを用いて人の頭蓋骨に対応した疑似耳 HEL/HER 4.4 の複数個所を振動ジェネレーター(アクチュエーター)で人の声と同様な加振を行います。これは最初それほど複雑なことには聞こえないかもしれません。しかし 正しく行おうとすると、リアルな骨伝導信号を生成しインイヤーヘッドセットの骨伝導センサーに疑似耳の最適コンポーネンツを介して伝えるのはかなり難しいことです。

骨伝導はどの程度必要か?

問題なのは主に、最近まで音声のどの周波数成分がどの音量で構造伝搬音トランデューサーがある内耳に届くのか誰も知らなかったことです。この疑問の答えを出すべく、私たちは実際の話者を用いて一連の測定を行いました。骨伝導音がどのように聞えるのか測定する為の骨伝導センサーを搭載したインイヤーヘッドセットのモックアップを用いました。これらのテスト結果から私たちは構造伝搬は女性と男性のあいだで殆ど差がないと結論付けました。しかしながら、男性の音声の方が私たちの目的にはより適していました。女性の声の周波数は基本的に男性よりも高く、低域での構造伝搬音の測定ができない為です。

これらの測定により複数の話者のあいだのバラツキの全体像を俯瞰することができました。これらの分析結果から平均的な伝達関数を導出しました。これはカスタマイズされた実験室テストで構造伝搬音をよりリアルにシミュレーションする為のベースとして活用します。言い換えると、私たちが行ったテストの結果に対応する構造伝搬信号を生成します。HMS II.3 LN-HEC アーティフィシャルヘッドの疑似耳に搭載した上述のアクチュエーターを介して生成します。この構造伝搬信号は 2 ウェイスピーカー搭載のフルバンド対応のアーティフィシャルマウスが発話し空気伝搬する信号と同期したかたちで生成されます。

私たちが生成する信号が実際の人の構造伝搬の範囲内に確実に収まるようにしました。実際の話者を用いたテストと ViBRIDGE を用いたシミュレーションの測定結果を比較し、両者のあいだに明確な相関を確認できました。シミュレーション結果は実際の人を用いたテスト結果に対応していました。即ち、 HEAD acoustics の ViBRIDGE を用いればヘッドセット製造メーカーは、実験室で骨伝導シミュレーションを行うことにより構造伝搬音センサー搭載のヘッドセットを包括的に、正確にテストすることが可能です。 

何故ヘッドセットメーカーは骨伝導を考慮する必要があるのか

音声をノイズや妨害話者から効果的に切り分けることことが最適なノイズキャンセレーション騒音環境での音声品質向上の大前提となります。しかし、それがすべてではありません。ヘッドセットのエコーキャンセレーションやその他の信号処理のような高度な技術は完全な音声検知の恩恵も受けます。音声の骨伝導成分を用いることにより予めノイズ除去された理想的な音声信号の実現が可能となります。

ノイズを構造伝搬音信号を用いることによりより効果的にノイズ低減を行う例をご紹介します。電話で通話しながら静かな部屋から食堂に移動することを想像してみてください。バックグラウンドノイズが突然変化します。私たちはこの変化を簡単にシミュレーションすることができます。アーティフィシャルヘッドの疑似マウスから音声再生を開始し、次に 3PASS lab や 3PASS flex のようなバックグラウンドノイズシミュレーションシステムで上記に対応するバックグラウンドノイズを再現することにより実験室でこれを行うことが可能です。 (Fig. 1).

Figure 1: Test sequence for testing the efficiency of a noise canceller with background noise

ヘッドセットマイクロホンのノイズキャンセラーはバックグラウンドノイズの急な変化に迅速に対応できなければなりません。そして、音声信号の品質を可能な限り維持しながらバックグラウンドノイズを可能な限り効果的に抑制する必要があります。ここがまさに骨伝導センサーが大きな効果を発揮する点です。骨伝導信号をマイクがとらえた空気伝搬音と比較することにより、話者の音声をバックグラウンドノイズから切り分けてノイズ抑制能力を向上させます。音声中に存在するポーズから、ノイズキャンセラーはバックグラウンドノイズを把握し、それと逆位相信号をより正確に生成することができます。その結果、バックグラウンドノイズの処理が格段に高速化し効果的になります。 Figure 2 はアーティフィシャルヘッドによる構造伝搬音シミュレーションがある場合とない場合のヘッドセットのバックグラウンドノイズの力密度スペクトルです。全周波数レンジで構造伝搬音加振シミュレーションし、8 ~ 28 dB 程度のバックグラウンドノイズ低減が可能であることが確認できます。この顕著な改善は構造伝搬音信号を用いることによってのみ可能です。

Fig.2: The power density spectra of the transmitted noise with and without structure-borne sound simulation

必要なものは?

ヘッドセットテストをテストする際、構造伝搬音シミュレーションは重要です。人の声により生成された空気伝搬音と構造伝搬音成分の標準化されたシミュレーションによってのみ再現可能で客観的かつ包括的な方法で様々な会話の状況でヘッドセットの評価~最適化が可能となります。HEAD acoustics はヘッドセットのテスト、最適化、検証の為のオールインワンソリューション提供します。

シミュレーションの為に、アーティフィシャルヘッド  HMS II.3 ViBRIDGE と疑似耳 HEL/HER 4.4 ViBRIDGE に加え、私たちは自動バックグラウンドノイズシミュレーションソフトウエア 3PASS lab を用います。これを音声品質・オーディオ品質テストの為の labCORE モジュール式ハードウエアプラットフォーム、全体テストプロシージャーを管理する測定分析ソフトウエア  ACQUA とシステムアップします。

音声認識の向上

将来的には骨伝導シミュレーションによる音声認識の改善を音声認識テストソフトウエア VoCAS を用いて行うことを想定しています。しかしながら、これには音声認識におけるノイズ低減ストラテジーを立てる為のシステマチックな調査が必要です。

お問い合わせください。