このニュースリリース記載の情報(製品価格、製品仕様、サービスの内容、発売日、お問い合わせ先、URL等)は、発表日現在の情報です。予告なしに変更され、検索日と情報が異なる可能性もありますので、あらかじめご了承ください。なお、最新のお問い合わせ先は、お問い合わせ一覧をご覧下さい。
2004年7月30日
肉声に近い自然なアナウンスを実現する
知的音声合成技術の開発に成功
文脈に応じて漢字かな混じり文の読み分けを可能に
日立製作所中央研究所(所長:西野 壽一/以下、日立)は、このたび、漢字かな混じり文を入力するだけで、肉声に極めて近い高品質のアナウンス音声を生成できる音声合成技術を開発しました。このシステムを用いることにより、頻繁に内容が変わるアナウンスやメッセージを、合成音声を使い、いつでも簡単に、低コストで作成することが可能となります。
近年、コンピュータによる合成音声は、電話のメッセージや自動応答システムをはじめ、パソコン上でのWebやメールコンテンツの読み上げ、カーナビゲーションの案内音声などで利用されています。しかし、従来の合成音声は肉声感に乏しく、機械的な印象がぬぐいきれないという課題がありました。また、漢字かな混じり文では、同じ表記の漢字でも前後の文脈で読み方が異なる場合がありますが、従来はそれらを自動で読み分けることができず、正確な読みを付与するための手間がかかるという課題がありました。
このような背景から、日立では、漢字かな混じり文を入力するだけで、肉声に極めて近い高品質なアナウンス音声を簡便に生成できる知的音声合成技術を開発しました。
開発技術の特長は次の通りです。
- 肉声感の高い高品質音声合成技術:
合成音声は、素片とよばれる音声の単位を組み合わせて生成されますが、どの素片を組み合わせるかが音質を左右します。通常、音声データベースから前後の音韻環境と韻律環境を考慮し、最適な素片が選択されますが、今回、日立は最適な素片の選択手法を開発するとともに、選ばれた素片を滑らかに接続するスムージング処理を改良することで、肉声感が高く、滑らかな合成音声の生成が可能となりました。
- 漢字かな混じり文を正確に読み分ける知的日本語処理技術:
単語間の関連性をデータベース化し、これを用いて前後の文脈から読みを正確に判断する技術を開発しました。これにより、「新宿に行(い)った」「会議を行(おこな)った」を読み分けるだけでなく、「この道を行(い)った」のように、助詞だけでは区別できない場合でも、正確な読みを付与することが可能となりました。
- 使い易い合成音声オーサリング技術:
より高品質な合成音声を簡単に作成できるよう、人間の音声認知特性を反映したGUI*1で、合成音声の編集作業を直感的に行える技術を開発しました。単語の読みやアクセント、英数字の読み方などをきめ細やかに指定できるほか、声の高さや速さなどのパラメータを細かく調整した結果を簡単に確認できるようになりました。
開発した音声合成技術を用いれば、漢字かな混じり文を入力するだけで、肉声に極めて近い高品質のアナウンス音声を生成することが可能です。今後は、日立は作成可能な声の種類を増やすなど、使い勝手を向上させ、駅や空港などの公共施設、デパートやアミューズメントパーク、オフィスなどの構内放送のアナウンスをはじめ、電子書籍や電子新聞の読み上げや、BGMとしてのニュースや株価の読み上げなど、幅広いシーンでの利用を目指します。
なお、開発した音声合成技術は、7月22日〜23日に、東京国際フォーラムで開催される日立ITコンベンション2004に出展しました。
|
|
用語説明
|
*1 |
GUI : マウスポインティングによるメニュー操作やグラフィックス操作を軸としたインタ フェースのことです。 |
| | お問い合わせ先 |
株式会社 日立製作所 中央研究所 企画室 [担当:内田、木下]
〒185-8601 東京都国分寺市東恋ヶ窪一丁目280番地
電話 : (042)327-7777(ダイヤルイン)
以上