BMW 740e は最新音声認識・NLUのショーケース

自動車 テクノロジー ITS
ニュアンスコミュニケーションズの新機能を搭載したBMW 740e
  • ニュアンスコミュニケーションズの新機能を搭載したBMW 740e
  • BMW 740e
  • BMW 740e
  • BMW 740e
  • BMW 740e
  • BMW 740e
  • BMW 740e
  • ニュアンスコミュニケーションズの村上久幸氏

BMW『740e』には「Dragon Drive」をベースにした最新の音声認識・自然言語認識(NLU)技術がいくつも投入されたいわば「ショーケース的」な車だ。そう語るのは、Dragon Driveを開発しているニュアンスコミュニケーションズの村上久幸氏。村上氏によれば、740eには6つの新しい技術が投入されているという。

まず、音声認識とNLUの処理エンジンは、車本体に実装されたものと、コネクテッドカーとしてモバイルネットワークを介したクラウド上のものを利用するハイブリッド方式である。ドライバーが発話した音声は、車両側に搭載されたエンジンとクラウド側のエンジンと両方で処理される。クラウド側の処理はタイムラグが発生するが、より複雑な単語やキーワードの認識が可能だ。システムは、両方の結果を比較しながらより精度の高い認識を行うようになっている。なお、ネットワークがつながらない場所では、組込みエンジンのみで処理が行われる。

次に「ALL-IN-ONEメニュー」と呼ばれる、メニュー構造を意識しない音声操作が可能な点だ。通常、ナビや車載端末の操作は、メニューによって処理カテゴリを選んだり、モードを切り替える。慣れればどの操作画面はどのメニューをたどっていけばいいかわかるが、慣れない車、あまり使わない機能は、設定画面を探すだけでも苦労する。ALL-IN-ONEメニューでは、操作モードやメニューの位置を意識せず、「〇〇に行きたい」といえば、単語を理解して必要な目的地検索とルート設定を行ってくれる。ナビを見ながら「メール送信」や「Bluetoothデバイスの接続」というような発話で、それぞれの処理メニューに移動できる。「戻る」ボタンにわずらわされることがない。

3番目は、助手席からの声をキャンセルするPIC(Passenger Interference Compensation)機能だ。740eには、音声認識用のマイクが運転席側のAピラー上部と助手席側の同じ位置にもついている。助手席側のマイクが拾った音声は「ノイズ」としてキャンセル処理を行う。これによって、ドライバーが発話中に助手席の人がなにかしゃべっていても誤認識することを防げる。


4番目は、音声によるメッセージ作成やツイッターへの投稿などを可能にするディクテーション機能だ。海外のIVI、車載端末では実現している機能だが、日本市場に投入される車両では初となる。

5番目は、オーディオ再生で曲名を正しく発話しなくても該当曲を検索できるパーシャル認識機能。テキスト入力の検索では当たり前の機能かもしれないが、音声入力でもそれが可能となった。「ナントカ〇〇」とわかっているキーワードだけで、〇〇が含まれる曲名から候補を検索してくれる。該当する曲がひとつなら、そのまま再生してくれるし、候補が複数あればどの曲にするか確認してくれる。

最後は、システムがメッセージを発話中でも次のコマンドや指示をだせるバージイン機能。電話の音声ガイドでは、ガイダンス中でもメニュー番号を押せばすぐに次のガイダンスに移動することができる。これと同様に、ナビ操作や車両設定でも、ガイダンスを全部聞き終わらなくてもすばやく指示をだせる。慣れると当たり前の反応だが、カーナビや車載端末でこの機能を実装しているものは少ない。

以上の新機能によって、740eの音声認識はかなり賢いものになっている。その背景には従来の音声認識技術を進化させたNLU機能がある(村上氏)。NLUでは、単に単語を認識するだけでなく、2語の組み合わせで意味を解釈している。そのため、指示があいまいであったり、目的地検索とルートガイド設定のような複数のタスクの組み合わせを「江の島のマクドナルド」のような自然会話的な発話で指示できる。

ニュアンスコミュニケーションズの村上久幸氏
740eで実現されているNLUは、AIというほどではない。従来の音声認識よりは高度な処理が可能だが、思ったことをさせるには、発話順や認識できるキーワードを意識した発話がまだ必要だ。しかし、村上氏はいう。

「AIの研究は進んでおり、対話式で駐車場やレストランを検索し、予約を行えるようなNLUコンポーネントはすでに持っています。サプライヤーや自動車メーカーの要望にあわせたチューニングや学習が必要ですが、実際に依頼や計画があれば数年で、市販車への実装展開は可能だと思います」

2020年にはレベル4の自動運転実現を目指すという声もある。そのときは、ナビ設定、エアコンの操作、メーター表示の切り替え、ライトやワイパーの操作など、ボタンやスイッチだけでなく音声制御できる車の実現を期待したい。これらが音声操作できるほうがレベル4自動運転より便利だと思うのだが。

《中尾真二》

【注目の記事】[PR]

編集部おすすめのニュース

特集