音声認識はどう進化するのか…「セレンス・ブラウザ」をReVision次世代ビークルサミットで紹介

自動運転やコネクテッドカーなど次世代モビリティにおいて、新たなビジネスモデルづくりとイノベーションを志す「第1回ReVision次世代ビークルサミット」が10月6~7日に開催された。その中でAI音声アシスタントを手掛けるセレンス・ジャパンの講演に注目した。

セレンスは2019年10月、車載向けのAI音声認識技術を主力とする米ニュアンス・コミュニケーションズから分社されて設立された。同社はこれまで、世界の著名な自動車メーカーやTier1とと共に音声認識技術を核としたユーザー・インターフェース(UI)で独自のソリューションを開発してきた。そんな中でUIは、移動の快適、楽しみというユーザの体験をデザイン・創造する基盤技術として考える時代を迎えることになったわけだ。

そんなUIの新たなサービスを実現する音声アシスタントの進化や、ユーザとのインタラクションがその価値をさらに向上させるAI技術を見渡し、次世代のクルマの価値創造とUIを提案するのが今回の講演のテーマだ。登壇したのはセレンス・ジャパンでプロフェッショナルサービスを担当するシニア・プリンシパル テクニカル・エクスパートの石川泰氏。

音声認識で重要となるのが利用状況に応じたパーソナライゼーション

石川氏はこれからのクルマと移動に求められるものとして、「知的好奇心を満たすために遊ぶ、見る、食べる、さらには運転することを通して得られる知的好奇心がある。“安全安心”や“快適”との実現も大きなポイントとなり、そうした中で得重要になるのがユーザーや利用状況に応じたパーソナライゼーションだ」と話す。

人とモノの関係は、モノが持つ機能に対して人が操作するHMI設計のポイントは操作負荷の低減することから始まった。「セレンスの前身ニュアンスがそのHMIとして音声認識エンジンをビジネスとして手掛けるようになったのもここからだった」と石川氏は振り返る。

やがて時代は推移し、今やモノの後ろにある種々サービスこそが製品の価値になる時代を迎える。そうなるとそのサービスがどういう状態なのか、どう使えるのかを判別するのに音声認識エンジンが有効となり、その価値は徐々に上がってくるようになった。そこでパーソナライゼーションを実現するために、「種々のサービスを音声でインターフェースするという観点で、種々のサービスとつながるHMI開発フレームワークをビジネスとしていくことになった」(石川氏)のが現時点のセレンスというわけだ。

車載UIとして音声認識の高い能力を発揮する『Cerence Drive2.0』

では、これからの時代はそこからどう発展していくのだろうか。石川氏は「これは単純にモノがサービスにつながっていることではなくて、ほかの人のユーザー体験を共有するとか共感も含めて、人とモノ、あるいは社会全体を通したユーザーとの相互作用を通じて、どう体験価値を向上させていくのかがデザインの主流になっていくのだと思う」と語る。

石川氏は、「そのためにセレンスは、AI音声アシスタントサービスを提供するプラットフォーム、あるいは自動車メーカーやTear1が考えた体験の価値というモノをユーザーに提供するフレームワークとサービスを実現しようと対策を進めているところ」と語る。

その実現に向けた技術的背景にあるのが『Cerence Drive2.0』だ。この中には車載環境における高機能な音声アシスタントを作るための、「音声認識」「音声合成」「自然言語理解」などのAI対応音声技術などが含まれ、これを活かしたマルチシートインタラクション技術や、JustTalk2.0といった技術の開発にもつながっている。石川氏は、「どんなサービスがあって、どのプログラムを立ち上げるかといった手続きを経ることなく、音声コミュニケーションはユーザーの要求そのものに対して、直接サービスへつなぐことができる大きなメリットを持つ」と、音声認識の高い能力に言及した。

その上で「今後さらに重要となって来るのが“照応”である」と石川氏は語る。たとえば、対象を選択するとき過去の履歴から「そこにして」と言うだけで目的地が設定できる。また、店舗などを探したことを記憶していて「まだ営業してる?」と訊ねればそれに回答する。これらはそれまでの行動履歴からAIが判断して適切な対応をするものだ。

車載で使える音声コミュニケーションのポータルサイト『セレンス・ブラウザ』

こうした技術をベースにセレンスは次なるステップを踏み出している。それが『セレンス・ブラウザ』だ。これは、言わば車載で使えるポータルサイトのようなもの。その他、ドライブ中の観光ガイドを行う「セレンス・ツアーガイド」やクルマの取り扱いなどの質問に応える「カーライフ」のほか、店を予約して前もって支払いを可能にする「セレンス・ペイ」による決済機能といった個々に独立した製品もあり、これらがすべて音声コミュニケーションによって完結できるのが最大のポイントとなる。

これを機にセレンスは、「以前のボイス技術を提供する会社というよりは、ユーザーが体験する多様なサービスを車載環境から直接使えるようなフレームワークと、直接サービスが提供できる会社として多くの製品を世界に向けて出そうとしている」(石川氏)という。

中でも「セレンス・ツアーガイド」は、ドライブ中に何かが見えるとき、GoogleやWikipediaから得た情報を元に音声での呼びかけに対して適切に回答することができる機能。これまでのように、最初に検索窓が登場して、そこで何かを告げてウェブリンクが出てくるのではない。直接、音声コミュニケーションによって回答が得られるのだ。 要望があればインタラクティブなナビゲーションと直接音声でつなげることもできる。つまり、キーとなるPOIに対する情報検索をしてコンテンツが提供できる新世代のツアーガイドということができるだろう。

石川氏は最後にセレンスについて、「新たな移動に対して自動車メーカーやTier1がこういう新たなサービスを作ろうと言ったときに、既存のサービスと統合してユーザーに対して有益に提供できる環境を作れる会社」とし、そのために「今後もユーザーの新たな体験を単なるサービスではなく、ユーザに届けるための企業として一緒に考えさせてもらい、それによって多くの人の体験を共有と言うことを含めたエコシステムを構築していければと考えている」と講演を締めくくった。

《会田肇》

編集部おすすめのニュース

おすすめのニュース