(株)日立製作所と(株)デンソーは、米国カーネギメロン大学(CMU
*1)との共同研究により、ドライバーが、車を運転しながら音声でインターネット等のネットワークにアクセスし、自由に情報を引き出すことができる、次世代車載情報サービス用音声対話システムの開発を進めています。2001年9月に開始したこの共同研究において、日立、デンソー、CMUの三者は、このたび、音声対話システムの基本構成(図参照)を構築しました。
開発を進めている音声対話システムは、ネットワークセンターと車載機の両方に対話処理のための音声認識エンジンと音声コマンドに応じた命令を実行するVoiceXMLインタプリタという対話処理機能を設置します。さらに、ネットワークセンターには、対話を実現するためのシナリオを生成する対話管理部を設置します。シナリオの生成に使用される言語は、音声認識・合成を含んだコンテンツをWeb上で記述するための標準言語であるVoiceXML*2を拡張して開発したものであり、対話の話題変化に対応した複雑な制御プログラムを自動生成することができます。
この音声対話システムを用いることにより、次のような音声対話が可能になります。
|
1. |
シナリオの自動生成により容易に対話の話題変化に対応可能です。例えば、経路設定の対話の最中に目的地の天気を問い合わせに応答し、その後、元の対話に戻って経路設定を続けることができます。 |
2. |
音声コマンドは車載機の音声認識エンジンにより検索コマンドに変換され、まず車載機で処理されます。車載機で処理できない場合は、ネットワークセンターへ送られ、そこで処理されます。この方式は対話の多くの部分を車載機のみで処理することができるため、対話処理の高速化、通信料の低減が実現できます。 |
2−1. |
オーディオ操作等、車室内システムに関する音声コマンドは、センターにアクセスすることなく車載機のみで処理されます。 |
2−2. |
車載機には、例えば、ナビで経路が設定された場合、目的地周辺や経路途中の情報がまとめてセンターから送信されることにより、情報が蓄積されます。 そのため、ネットワーク情報を問い合わせる音声コマンドも、検索コマンドに変換された後、一旦車載機に蓄積された情報に基づき処理され、車載機に情報がない場合にセンターに送られます。 将来的には、あらかじめ個人の好みやプロフィールに応じた情報をセンターで自動的に抽出し、車載機で蓄積することも可能です。 |
<基本構成図>
|
 |
この共同研究では、日立が電話から音声でインターネット上の情報を入手できる音声ポータルで培った技術(VoiceXMLインタプリタ、センター側音声認識エンジン)を、デンソーがカーナビゲーションで培った技術(車載機側音声認識エンジン、雑音抑制技術)を、CMUが自然言語処理をベースにした対話管理技術をそれぞれ提供し、システムの開発に取り組んでいます。
近年、カーナビゲーションシステムを進化させた形として、車からインターネット等のネットワークにアクセスし、各種の情報を受け取る新しいサービスの開発が盛んです。 この共同研究は、車を運転しながらe-mailサービスを利用したり、店舗情報を検索したり、音楽やニュースの配信を受ける等の次世代の車載情報サービスを想定し、ドライバーの望む情報を音声で自由に引き出せる
ヒューマン・マシン・インターフェース(Human Machine Interface:HMI)技術の確立を目指しています。
<用語の説明>
*1 |
CMU(Carnegie Mellon University):
米国ピッツバーグ市にあり、音声認識、機械翻訳、人工知能、ロボット工学等の研究活動で世界的に有名。 |
*2 |
VoiceXML:
VoiceXMLはAT&TおよびIBM, Lucent Tehnologies, Motololaが中心になり開発をすすめてきた音声対応のWeb記述言語。これらの企業が設立メンバーとなり約60社で1999年に
VoiceXMLを推進する「VoiceXML Forum」を設立しました。 同Forumは、2001年12月、VoiceXML version
2.0を、W3C(World Wide Web Consortium)へ提案しました。VoiceXML version 1.0は、2000年5月、W3Cにより既に承認されています。
|
<CMU共同研究参加者> |
|
Eric H. Nyberg, Ph.D. Associate Professor
(エリック H ナイバーグ)
Teruko Mitamura, Ph.D. Senior Research Scientist
(三田村 照子)
|
|