【PR】車載セキュリティに声紋認証を活用、そのメリットとは…ニュアンス社 アーンド・ヴァイル氏

ニュアンスコミュニケーションズの音声認識システムのキーマン、アーンド・ヴァイル氏に技術のポイントと将来について聞いた

自動車 テクノロジー ITS
ニュアンス・コミュニケーションズ オートモーティブ部門シニアバイスプレジデント兼ジェネラルマネージャーのアーンド・ヴァイル氏
  • ニュアンス・コミュニケーションズ オートモーティブ部門シニアバイスプレジデント兼ジェネラルマネージャーのアーンド・ヴァイル氏
  • 車載セキュリティに声紋認証を活用、そのメリットとは
  • ニュアンス・コミュニケーションズ オートモーティブ部門シニアバイスプレジデント兼ジェネラルマネージャーのアーンド・ヴァイル氏
  • 個人を認証するために最初のみ“ハロー・ドラゴン”と呼びかけて登録させる
  • 車載セキュリティに声紋認証を活用、そのメリットとは
  • ナビゲーションの利用で目的地を検索
  • 車載セキュリティに声紋認証を活用、そのメリットとは
  • 電話をかける相手も認証がベースとなる

ドライブ中にカーナビやカーオーディオの操作を、安全かつスムーズに行う方法として筆頭に上がるのが音声認識によるコマンド入力だ。音声認識や音声合成といった音声関連ソリューションのパイオニアであり、またトップベンダーでもあるニュアンスコミュニケーションズ(ニュアンス社、本社:米国マサチューセッツ州)が近年、特に注力しているのはオートモーティブ事業だ。

同社が提供するコネクテッドカー向け音声ソリューション「Dragon Drive」は、BMWやアウディ、メルセデスベンツ、トヨタや上海汽車など、世界中の自動車メーカーで採用され、OEM供給の関係を拡大している。同社の技術による高い認識精度は多くのユーザーが知るところでもある。今回はその車載向け音声ソリューションのキーマンであるオートモーティブ部門シニアバイスプレジデント兼ジェネラルマネージャーのアーンド・ヴァイル氏に自社技術のポイントと、その将来について聞いた。

◆カーナビへの対応で広く認知された音声認識

----:ニュアンス社として、音声認識システムを手掛けたのはいつ頃からでしょうか。

アーンド・ヴァイル氏(以下ヴァイル氏):2000年に音声認識の会社を買収したことから今の事業が本格的にスタートしました。前身はスキャンソフトという社名でしたが、同社が2005年にニュアンス社を買収し、今の名を名乗るようになりました。

----:ニュアンス社はPC用の音声認識ソフト「ドラゴンスピーチ11」を供給する会社としても知られていますが、自動車分野への参入はいつ頃でしょうか。

ヴァイル氏:1998年から99年頃だったと思います。当時はハンズフリー通話システムの操作が主な用途で、コマンドを20ぐらいしか認識できない簡単な仕様でしたが、以来実績を積み重ね、車載分野での経験は極めて豊富です。

----:当時は日本でも音声認識に対する取り組みが進んでいましたが、認識するためにコマンドを覚えなければならなかったり、その認識率の低さが敬遠される要因となったという経緯があります。音声認識システムとして広く認知されるようになったきっかけは何だったのでしょうか。

ヴァイル氏:一番大きいのはカーナビゲーションでの高度な利用への対応を進めたことです。たとえば、ドイツだけでも地名は7万種類もあります。それを音声で検索するには認識語彙や処理速度を大幅に向上させなければいけませんでした。住所検索以外にも目的地として、映画館やレストランなどの施設名称も対象にしなければなりません。そのために処理能力を当初より10万倍にまでアップしていました。つまり、音声を使って約200万個所を検索できるようになったのです。

----:車載用途での認識率改善の鍵になったのはどのようなポイントでしょうか。

ヴァイル氏:走行ノイズ対策をはじめ、様々な要因がありますが、ここ欧州での特徴的な対策の一例として、地名や施設名称の認識があげられます。たとえドイツ国内であっても、名称は必ずしもドイツ語であるわけではありません。フランス語やイタリア語など外国語の呼称を使っていることもあります。音声で目的地を入力した際はこれらを自動的に判別できなければなりません。多言語対応については様々な統計的処理や音素レベルでの工夫を行うことで、認識アルゴリズムを改善させていきました。

----:ソフトウェアや認識アルゴリズムの改善は大きなポイントと見受けられますが、ハードウェアの性能向上も認識率改善には大きな効果があったのではないですか。

ヴァイル氏:以前はCPUのクロック速度が“MHz”単位でしたが、今は“GHz”単位にまでレベルアップしています。つまり、CPUの処理速度の向上と、それに対応した音声認識処理の最適化が複雑な音声コマンドのスムーズな処理を可能にする大きな役割を果たしたのです。

◆Dragon Drive のメリット、「Wake Up Word機能」と「声紋認証の活用」

----:「Dragon Drive」は車載機器とクラウド上の両方に音声認識機能を搭載する「ハイブリッド方式」の構成を採用していることが大きな特徴だそうですが、その他にどのような特徴があるのでしょう。

ヴァイル氏:一点目はWake Up Word機能です。これまでの技術では、ステアリング上にある「発話ボタン」を押してから音声コマンドを話す必要がありましたが、Dragon Driveでは、そのようなボタン操作が不要で、「Hello, Dragon」という音声での呼びかけで機能にアクセスすることができます。もう一点は声紋認証の活用です。クルマは必ずしも一人だけが使うものではありません。家族みんなで使うことが多いですが、カーナビゲーションの目的地設定をはじめ、フェイスブックなどのSNS、メッセージなどの個人データ、電話のアドレス帳もそれぞれ違うので、これらを声紋で区別できればドライバーごとの設定を保護するセキュリティ機能として役立ちます。

----:声紋認証はセキュリティ向上にどのくらい効果的なのでしょうか。

ヴァイル氏:この技術はテレフォンバンキングのユーザー認証にも利用されています。あらかじめ記憶させた個々の声の特徴である声紋データとのマッチングによりセキュリティをチェックしています。1台のクルマの利用者数はせいぜい5名程度。それぞれの声紋データを事前に登録しておき、利用時の声紋データと比較して現在のドライバーを特定します。初めて利用する際に「Hello, Dragon」と3回話させるのも、声紋データを登録するためです。この技術を用いることで、アプリケーション関係の設定だけではなく、シートポジションやステアリング位置を自動的に調整するなど、様々な個人設定に応用することも可能になります。

----:実際の利用シーンでは、「カーナビ」「オーディオ」「電話」といった操作モードを切り替えなくてもダイレクトに認識してくれることに大きなメリットを感じました。

ヴァイル氏:その点も、Dragon Driveのメリットの1つです。我々はこの機能を「All Inclusive Menu」と呼んでいるのですが、現在の操作モードを意識することなく、ラジオであれカーナビであれ、必要な機能に音声コマンドで素早くアクセスできます。

◆さらなる世界展開へ

----:ニュアンス社がティア1サプライヤーとして直接、自動車メーカーへ納入することはないのでしょうか。

ヴァイル氏:車載向けの音声認識システムはOEM先の要求に応じて動作すべきものと考えています。我々の技術、特に組込み型の音声認識や音声合成はティア1サプライヤーが自動車メーカーに納めるシステムに入ることが多く、その場合はサプライヤーとの契約となります。一方、クラウド型音声認識やコンテンツ提供サービスなどについては、弊社が直接自動車メーカーと契約するケースも増えつつあります。つまり、システムを納入したサプライヤーとの契約と、その先の自動車メーカーとの二つの契約を持って臨んでいるというのが現状です。

----:今回ダイムラー社に提供するDragon Driveの主要機能と概要についてお聞かせ下さい。

ヴァイル氏:ダイムラー社がニュアンスの自然言語理解技術およびクラウドベースの音声機能を幅広いアプリケーションに組込むことで、ドライバーが自分の好みのコンテンツを利用するための直感的なインターフェースを提供します。たとえば、「次のガソリンスタンドはどこ?」や「ここから近いレストランを表示して」など、一度の発話で指示でき、カーナビ画面を注視したり操作したりすることによる注意散漫を抑制できます。

----:ところで、最近はスマートフォンをナビゲーション代わりに使う人が全世界で増え、CarPlayやAndroid Autoといった無料で使えるシステムも注目されています。そこには音声認識システムも備えられているわけで、それらと違いは見出せるのでしょうか。

ヴァイル氏:実はDragon Driveは通信ができない時でも基本的な音声認識も動作するハイブリッド方式となっています。CarPlayやAndroid Autoの音声認識を利用するには通信ができることが大前提。地下駐車場や郊外など、通信ができないところで目的地を設定することも多いですが、電波が届く所に出なければ使えないのは不便です。また、Dragon Driveは基本的に黒子としての存在です。つまり、各自動車メーカーは独自のブランド・アイデンティティや安全性に対するポリシーを保ったまま、Dragon Driveの機能を利用することができます。この点も各自動車メーカーから高く評価されています。

----:ニュアンス社として音声認識システムで今後のどのように展開していくお考えでしょうか。

ヴァイル氏:今もっとも開発に力を入れているのは、ドライバーのごく普通の話しかたを理解することのできる自然言語認識への対応をさらに高めることです。また、より多くの自動車マーケットに対応するために、対応言語をもっと増やす必要があります。たとえば、欧州なら国境を超えるドライブで様々な言語に遭遇するのは日常茶飯事です。日本でも英語の音楽を聴く機会は多いと思います。また、音声認識システム以外のコマンド入力開発にも注力しています。その一つがアウディ『Q7』にも採用されたタッチパッド上での手書き文字認識技術です。今後は音声認識と組み合わせたマルチモーダル入力の技術として、開発をさらに進めていく考えです。

《会田肇》

【注目の記事】[PR]

編集部おすすめのニュース

特集