日立製作所 中央研究所(所長:西野壽一)は、このたび、経済産業省のリアルワールドコンピューティング(RWC)プロジェクトに参画して開発した「日本手話*1コーパス」(手話の発話映像に、手指や頭部・表情・身振りなどの動作を示すラベルをつけたもの)の一部を研究用途として、インターネット上で無料公開します。
これにより、手話の研究において鍵となる手話コーパスを多くの研究者に利用してもらうことが可能となり、手話研究の裾野を広げ、バリアフリー情報化社会の発展への寄与をめざします。
手話の言語研究や手話をインタフェースとする情報機器の研究・開発において、手話の発話映像データベースは大変有用な情報です。しかし、手話の発話映像データベースを一から構築するのはとても手間がかかるため、研究を進める上での障壁となっていました。
一方で、手話の研究・開発が多くの方に広がることは、進化する情報化社会のなかで手話研究の高度化や手話をインタフェースとする情報機器の発展のために重要です。
このような背景から、今回、日立はこれまで経済産業省のRWCプロジェクトに参画、構築してきた手話の発話映像データベースを整備し、ラベル付きの「日本手話コーパス」としてインターネット上で無償公開します。
このラベル付き日本手話コーパスは、手話研究の資料として、またジェスチャーや表情の認識に関する研究の資料として利用可能です。
今回公開するデータは、手話の基本である100文ですが、今後は本サービスの利用者からのフィードバックを参考にして、公開データを増やしていくことを検討しています。
【公開する日本手話コーパスの概要】 |
・発話内容:日本手話の基本文型を示す文例100文(目上の人に対するようなやや丁寧な表現) |
・手話データ内容: |
|
(1) 手話映像データ |
: |
AVIファイル形式、ビデオサイズは720×480ドット、1文あたり約30MB。 |
(2) ラベル情報 |
: |
手指動作および非手指動作について記述した文字情報。非手指動作は顎、頭、眉、瞼など8箇所の部位について合計51種類のラベルを用意。
|
(3) 手袋型入力装置による手動作データ |
・表示ツール |
: |
発話映像の時間軸に沿ってラベル情報を表示。手動作データに基づく手話アニメーションを発話映像と同期させて表示。
|
【公開HP】
http://www.academic-net.jp
「アカデミックネットワークの手話フォーラムメンバ」に登録後(無料)、手話データおよび表示ツールをダウンロードし、研究に活用できます。なお、無償公開は、2002年の9月13日から開始する予定です。
|
<補足>
■開発の経緯
日立では、聴覚障害者と聴者のコミュニケーション支援を目的に、1993年度から2001年度まで、経済産業省のリアルワールドコンピューティング(RWC)プロジェクトを実施する技術研究組合新情報処理開発機構(RWCP)に参画し、日本手話を対象とした手話−日本語翻訳技術*2の研究開発を行いました。
このなかで、日本手話の文法規則を抽出するために、日本手話コーパスを開発しました。
|
■注釈 |
(1) |
日本手話:日本で使われている手話は「日本語対応手話」と「日本手話」に大別されます。日本語対
応手話では、音声として話される日本語の語順で手話単語を表現します。これに対して、手話を母
語とする聴覚障害者同士の会話で使われる日本手話は、日本語とは異なる文法をもつ言語です。
主として手指動作で単語を表現し、文法情報の多くを非手指動作(頭部動作・表情・身振りなど)で
表現します。非手指動作の中でも特に頷きなどの頭部動作は、文の構造に関わる文法マーカとして
重要な機能を持っています。例えば、手指動作で「私・パソコン・本・買う」という単語列を表現する際
に、「私」「本」「買う」のそれぞれの手指動作の後に'頷き'の頭部動作を行うと、「私はパソコンの本を
買います」いう意味になります。さらに「パソコン」の後にも'頷き'の頭部動作が加わると「私はパソコ
ンと本を買ます」という意味になります。
|
(2) |
手話−日本語翻訳技術:手話から日本語への翻訳を行う技術。日立で開発した技術では、手袋型の入力装置から手指動作を、ビデオカメラから頭部動作を入力し、パソコン上で日本語文に変換します。RWCプロジェクトの最終成果として、産業技術総合研究所の協力を得て開発しました。本技術の開発では、日本手話コーパスのデータを手話文法の分析用データとして利用するとともに、頭部動作認識・手動作認識の実験用データとしても活用しました。 |