ページの本文へ

AI-OCRとは?~OCRとの違い・メリット/選定・導入に失敗しない3つのポイントと活用事例~

AI-OCRとは?~OCRとの違い・メリット/選定・導入に失敗しない3つのポイントと活用事例~

さまざまな分野での活用で注目されるAI(人工知能)。いま、多くの企業ではAIとOCRの技術を融合させたAI-OCRの導入によって、これまで人の手作業で行っていた手書き帳票のデータ入力作業を効率化し、業務生産性を高める動きが加速しています。

本稿では、AI -OCRとは?OCRと何が違い、どんなメリットがある?という基礎知識から、AI-OCRの選定・導入時に注意すべき3つのポイントとその解決策、さらに具体的な活用事例について解説します。

AI-OCRとは?従来のOCRとの違い

AI-OCRとは?従来のOCRとの違い

OCRとは、画像データからテキスト部分を認識し、文字データに変換する光学文字認識機能のこと。AI-OCRは、AIの特徴であるディープラーニング(深層学習)により文字の補正結果を学習することで、従来型のOCRの弱点であった識字率(文字の認識精度)を向上することができます。

さらにAI-OCRは、従来のOCRでは難しかった手書きの文字列や、非定型フォーマット文書の文字の認識が可能といったメリットがあり、その適用可能な業務範囲の広さが、注目を浴びているのです。

AI-OCRの活用メリット 従来のOCRとの違い・比較

一般的にAI-OCRは、従来のOCRと比較して以下の3つの活用メリットがあると言われています。

  1. 識字率(文字の認識精度)が高い
    従来のOCRは、あらかじめ決められたロジックの範囲内でしか、文字の識別を行えませんでした。しかしAI-OCRはAIの特徴である深層学習(ディープラーニング)などの技術により、識字率(文字の認識精度)が向上しました。具体的には複雑な手書き文字(乱筆文字、区切り線のないフリーフォーマットの手書き文字、罫(けい)線被り文字など)の読み取りが可能です。
  2. 多様なフォーマットの帳票に対応できる
    従来のOCRは、事前に読取位置や項目など、読み取り対象の書類の詳細を定義する作業が必要でした。しかしAI-OCRならAIが読取位置や項目を自動抽出してくれるため、事前の面倒な設定が不要。請求書や納品書、発注書など取引企業ごとに様式が異なる非定型帳票、契約書などの任意様式の文書の文字認識が可能です。
  3. RPAとの連携でさらに業務効率が向上
    従来のOCRでは、例えば紙の請求書の情報を会計システムなどに入力しようとした時、情報ごとの対応付けや部門、科目などの仕分けなど、人手による作業が残っていました。また、そもそも決まったフォーマットの帳票しか対応できない点も、大きな足かせとなっていました。

AI-OCRはRPA(Robotic Process Automation)との連携が注目されています。前述のようなこれまで人手で行っていた作業をソフトウェアロボットで自動化するRPAとAI-OCRとを組み合わせることにより、紙帳票からのデータ抽出~データ入力~集計・加工~出力といった一連の業務を自動化することが可能となります。

コロナ禍で伸長を続けるAI-OCR市場

こうしたメリットから注目を浴びるAI-OCR。その市場規模は、コロナ禍におけるペーパーレス化と業務自動化、そしてDX(デジタルトランスフォーメーション)ニーズを背景に、伸長を続けています。2023年には「インボイス制度」も始まり、これまで紙が主流であった企業間の請求書のやり取りについても電子化が加速しています。

また、各調査会社による市場動向では、OCRソリューション市場は2019年から2年連続前年比120%と成長を続けており、中でもけん引しているのはAI-OCRと言われています。

これを裏付けるように各社から続々とAI-OCRツールやサービスが提供されており、今や業界を問わず多くの企業や組織で、AI-OCRを活用した業務効率化への動きが高まっています。

しかし、皆さんお気づきの通り、「AI-OCRであればなんでもOK」ではありません。実際にAI-OCRを導入した先行企業からは、「期待したような効果がなかった」という声も聞かれます。

ここからは、AI-OCRの選定・導入時に注意すべきポイントを挙げ、それに対する日立の解決策を解説していきます。

AI-OCR選定・導入時に注意すべき3つのポイントと、日立の解決策

注意すべきポイント[1] 文字認識のエラー頻度は?継続的な向上は可能?

前述の通りAI-OCRは、AIの特徴であるディープラーニング(深層学習)によって文字の補正結果を学習することで、識字率(文字の認識精度)を向上しています。しかし当然ながらこの技術は各社さまざまです。また、実際の業務ではクセの強い手書き文字や走り書きの処理などもあり、そもそも「AI-OCRで100%の読み取りを行うことは、理論上不可能」と言われています。そうなると結局、AI-OCRが読み取った文字に間違いがないのかを人が確認し、間違いがあれば人手で修正する、といった作業が必要になります。

日立の解決策[1] 高精度な手書き文字認識AIと継続的な認識率向上を実現

日立が提供するAI-OCR「帳票認識サービス」は、日立独自の技術に加えて他社の認識技術も併用。「定型」「非定型」帳票に最適なAI-OCRエンジンを選択することで、文字認識精度を向上させています。加えて、認識モデルをアップデート可能な学習機構を有しており、継続的な認識率向上を実現しています。

日立の解決策[1] 高精度な手書き文字認識AIと継続的な認識率向上を実現:帳票認識サービスでは、ディープラーニング技術の活用によって、平仮名、片仮名、漢字、数字、アルファベット、記号など、さまざまな手書き文字を読み取れます(認識率:99.2%以上、注※定型帳票認識エンジンを使用した文字認識率です。読み取り帳票の影響状況などで変動します。)。読み取り例:シングルライン(行ごとに手書き文字を読み取り)、マルチライン(複数行の手書き文字を読み取り)。上記の文字列のほかに、チェックボックスや丸囲み文字も読み取り可能です。

注意すべきポイント[2] OCRの前処理は自動化できる?

ビジネスにおいては自社の定型帳票だけでなく取引先からの見積書、注文書、納品書、請求書といった多種多様な帳票に対応する必要があります。AI-OCRを利用する際、さまざまな帳票のフォーマットを読み取るための「テンプレート」を選択する前処理が、意外と面倒で手間がかかります。「テンプレート」とは、帳票のレイアウト中の読取箇所が分かるように、システム上で帳票画像にマーキングすることです。これを行うことで、帳票の画像のどの部分を読み取りたいのかを、AI-OCRに伝えることができます。

AI-OCRを活用する際、この「OCRの前処理をどこまで自動化できるか?」は非常に重要なポイントです。

日立の解決策[2] 事前の位置調整なしでの自動化(テンプレート自動振り分け、テンプレートフィッティング)

日立が提供する「帳票認識サービス」は、読み取り帳票を自動で分類し、テンプレートの選択まで行います。前処理機能が帳票の種類の確認、テンプレートの選択、画像補正などを自動で実施。利用者は文字を読み取りたい帳票を選ぶだけで多量の帳票の読み取りがスピーディーに行えます。

非定型帳票においても業務において認識対象としたい項目を指定するだけで、事前の位置指定なしに帳票から目的とする認識項目を特定できます。AI-OCRに読み取ってほしい場所を詳細に設定する必要がなく、多様な様式の帳票を自動的にAI-OCRが判断。帳票のフォーマットを問わない読み取りが可能です。

日立の解決策[2] 事前の位置調整なしでの自動化(テンプレート自動振り分け、テンプレートフィッティング):従来のOCRでは、帳票のイメージデータごとに、人が帳票の種類の確認・テンプレート選択・画像補正を行ってから認識エンジンで文字を読み取りする必要がありました。帳票認識サービスでは、前処理機能により、帳票の種類の確認・テンプレート選択・画像補正を自動化し、準備作業を含め文字の読み取りを自動で実施できます。

文字の読み取りを行う認識エンジンには、大別すると次に示すように2種類のエンジンがあります。「帳票認識サービス」では、日立製かどうかを問わず複数の認識エンジンが利用可能であり、さまざまな種類の帳票の読み取りに対応できます。

  • 定型帳票認識エンジン
    フォーマットが決まっている帳票のイメージデータを、高速・高精度にデータ化するAI-OCRエンジンです。ディープラーニング技術を活用し、活字文字に加えて、これまで自動認識が難しかった手書き文字を高精度に読み取れます。トレーニングデータの準備、または業界特有の言語モデルと連携することで、多言語対応や業界用語への拡張対応も可能です。

  • 非定型帳票認識エンジン
    さまざまな非構造なドキュメントから、情報を正確に抜き出して整理するAI-OCRエンジンです。フォーマットがバラバラな帳票にも対応可能で、さまざまな業務場面で活用できます。業務に合わせたトレーニングやチューニングを行うことで、人間のように文字を読み取り可能です。

注意すべきポイント[3] 認識結果の確認作業工数は?

前述の通り、AI-OCRに100%の認識率を求めることは困難ですので、認識結果は人の確認が必要となります。読み取り作業は自動化できたものの、読み取り結果をその都度人が確認しなければならないと、業務全体の生産性は高まりません。

日立の解決策[3] 「確信度」スコアにより人による確認工数を削減

日立が提供する「帳票認識サービス」は、AI-OCRの認識結果の“確からしさ”を、日立独自のアルゴリズムによる「確信度」というスコアとして提供します。さらにAI-OCR認識結果と確信度に対し、適用業務におけるチェックルール(桁数チェックや形式チェックなど)を適用して補正することで、AI-OCRの不読・誤読による誤ったデータ登録リスクを低減させています。

これにより、・認識結果が確信度「低」の場合は、人による確認を実施・確信度「高」の場合は、人は確認せずに自動登録という具合に、誤登録リスクと人的な確認工数を抑制しながら、帳票業務の自動化率を向上できます。

さらに、認識結果と別系列の業務データとの突合チェックを行い、突合チェック結果も確信度の補正に活用することで、誤ったデータ入力のビジネスリスクをさらに低減し続けることも可能です。

日立の解決策[3] 「確信度」スコアにより人による確認工数を削減:従来のOCRでは、認識エンジンの読み取り結果確認について、すべてのデータを人が確認し、誤り補正を行う必要がありました。帳票認識サービスでは、後処理(確信度算出とルールチェック)により、確信度「高」のデータは確認不要となります。確信度「低」のデータだけ人が確認・補正を行います。

それでは次に、日立が提供するAI-OCR「帳票認識サービス」の実際の活用事例を見ていきましょう。

AI-OCR活用事例

AI-OCR活用事例[1] 日立財務部門

AI-OCR活用事例[1] 日立財務部門 年間25万件、14,500時間の出納業務を自動化
作業時間を約5割削減し、DXを推進

日立グループは、財務部門の年間25万件におよぶ出納業務が取り扱う帳票の読み取りに「帳票認識サービス」を活用しています。約4,800種類の請求書と約200種類の社内申請書の読み取りを自動で行うだけでなく、結果の確からしさを「確信度」で評価して目視での確認作業を減らし、業務の大幅な効率化が期待されています。

<導入前の課題>

  • コロナ禍でテレワークが推奨される中、阻害要因となる「紙の書類や証票」を多く扱う財務部門の出納業務ではさらなる自動化・省人化に向け、デジタル技術の適用範囲の拡大と、手書き文字など多様な帳票への対応が求められています。
  • 出納業務の代表的な作業には申請者がパソコンから入力した情報と請求書などの証票を照合する証票確認作業があります。日立グループでは年間25万件の出納業務において、帳票データの読み取り・照合に14,500時間もの作業時間がかかっていました。

AI-OCR活用事例[1] 日立財務部門:<導入前の課題>:導入前の総業務時間 14,500時間/年間(請求書・社内申請書をスキャナーで読み取り、申請内容をスキャンデータから目視で読み取り、データ入力。申請内容を社内規定と照合し、出納業務システムに登録。)

<導入後の成果>

  • 本サービスの導入により、約4,800種類の請求書と約200種類の社内申請書を分類、読取位置が指定されたテンプレートを自動で選択し、「消費税額」「課税対象額」「口座名義人名」などの自動読み取りが可能に。また、日立独自のアルゴリズムにより、AI-OCRの読み取り結果の確からしさを「確信度」として数値化し、誤認識の可能性が高いデータを仕分け可能です。
  • 財務担当者は全件を1つ1つ目視で確認してデータ入力する必要がなくなり、作業工数を大幅に削減。業務時間を7,100時間、約5割削減することを見込んでいます。

<導入後の成果>:導入後の総業務時間 7,400時間/年間:7,100時間(約5割)削減!(スキャンデータについて、帳票認識サービスで自動で帳票を分類・読み取り、テンプレート選択。認識エンジンが確信度を算出し、確信度「低」の場合のみ結果確認、必要に応じて修正・手動入力。これによって読み取り結果の全件確認が不要に。さらに入力データについて、InnoRulesによって複雑な社内規定と申請内容を自動照合し、OKの場合は自動で出納業務システムに登録。NGの場合のみ、人による確認を行う。)※InnoRulesは、INNORULES社の商標または登録商標です。

帳票のセッティングや読み取り後の目視による全数確認作業などの人手による業務が大幅に削減されることで、担当者の負荷軽減および残業時間の削減、休暇の取りやすさなどの「働き方改革」にも貢献します。

AI-OCR活用事例[2] 一般社団法人全国銀行協会 様

AI-OCR活用事例[2] 一般社団法人全国銀行協会 様 金融機関の「手形・小切手 交換業務」を効率化
中核となるイメージデータ化のAI-OCR技術に日立 帳票認識サービスを採用

一般社団法人全国銀行協会(以下、全銀協)は、手形・小切手*1のイメージデータの送受信によって決済を効率化する「電子交換所」を設立、2022年に稼働しました。日立はシステム委託先業者に選定され、効率化の中核となる画像処理に「帳票認識サービス」が利用されています。

*1
手形・小切手とは?:金額、日付などの必要事項を記入し相手に渡し(振り出し)、支払いをする現金の代わりとなる用紙。受け取り直後に現金化できる小切手、記載された期日後に現金化する手形という違いがあります。また手形には約束手形と為替手形があります。2020年度の国内の手形交換高は約3,911万枚、金額にして約126兆6622億円にのぼります。 出典:全国銀行協会Webサイト 2020年度 全国手形交換高より

<導入前の課題>

  • 金融機関はこれまで、顧客から取り立てを依頼された手形・小切手について、各地の「手形交換所」を通じて現物による交換・決済を行っていました。
  • 依頼元である持ち出し銀行から手形交換所へ、手形交換所から持ち帰り銀行へ現物を搬送する必要があり、煩雑かつコストもかかっていました。

AI-OCR活用事例[2] 一般社団法人全国銀行協会 様 <導入前の課題>:従来の交換・決済方法では、お客さまがα銀行(持出銀行)に持ち込んだ手形・小切手について、手形交換所に搬送し、そこからさらにβ銀行(持帰銀行)に搬送する必要がありました。

<導入後の成果>

  • 「電子交換所」設立により、手形・小切手のイメージデータの送受信によって決済が可能となりました。
  • 現物の搬送により行われてきた金融機関間の手形・小切手の交換業務を、イメージデータの送受信により完結。手形を持ち出す金融機関はスキャナーで画像化したイメージデータを「電子交換所」に送信し、手形を持ち帰る金融機関は「電子交換所」からデータを取得する仕組みです。

<導入後の成果>:帳票認識サービスの活用により、お客さまがα銀行(持出銀行)に持ち込んだ手形・小切手について、イメージデータに変換して電子交換所に送信、β銀行(持帰銀行)は電子交換所からイメージデータを受信して完結します。これにより、金融機関間の手形・小切手の現物搬送が不要となります。

これにより、金融機関間の手形・小切手の現物搬送が不要となるため、紙での手続きを希望する利用者ニーズへの対応を維持しながら、金融機関における運搬費を含めた事務コストの削減、災害時の輸送トラブルなどのリスク軽減を図り、手形・小切手による決済業務の合理化を実現しました。

AI-OCRその他の活用事例

AI-OCRその他の活用事例(OCRの前処理は自動化。高精度な手書き文字認識と継続的な認識率の向上。認識結果の確認作業工数を軽減できる仕組み。)

そのほかAI-OCRは、以下のような業界の業務を効率化することが可能です。

  • 地方自治体:各種給付金などの申請対応業務
  • 金融機関:口座開設申込書、公共料金申込書、口座振替依頼書、振込依頼書、クレジットカードの申込書、リース申込書など手書き帳票のデータ化とシステムへの登録業務
  • インフラ事業:電気・水道・ガスなど公共料金の申込書の処理業務
  • 製造・メーカー:取引先から紙で届く各種部材の注文書の受発注システムへの登録業務
  • コンタクトセンター:FAXで届く契約書から契約番号をデータ化、システムへの登録業務
  • 不動産業:紙で管理されている契約情報をデータ化、システムへの登録業務
  • 食品販売:紙で管理されている過去の販売データのシステムへの登録業務
  • 物流業:手書きで管理されている倉庫作業員の作業予定、トラックドライバーの配車計画のデータ化業務

まとめ AI-OCRによる業務効率化を成功させるには?

いかがでしょうか。本稿ではAI-OCRとは?活用するメリットは?という基礎知識から、導入・選定時に注意すべき3つのポイントについて、日立の解決策と具体的な活用事例を交えて解説しました。

AI-OCRを活用した業務効率の向上を実現するには、以下の3つの視点でのサービスの検討が欠かせません。

  • 高精度な手書き文字認識と継続的な認識率の向上が期待できるか
  • OCRの前処理は自動化できるか
  • 認識結果の確認作業工数を軽減できる仕組みがあるか

日立が提供するAI-OCR「帳票認識サービス」は、これら3つの課題に対し、日立独自の技術と他社の技術を組み合わせたサービスプラットフォームとなっています。

日立が提供するAI-OCR「帳票認識サービス」:日立の技術に加え、他社の認識技術を採用し、帳票に応じた最適な認証技術を提供。(エンドユーザーが業務アプリ、モバイルアプリを通して帳票認識サービスに接続。帳票認識サービスでは、帳票RPAアプリでAPIにより認識エンジンを振り分け、テンプレートを選択。(テンプレートは契約IDごと、帳票類ごとの認識エンジンを管理)非定型帳票認識エンジンでは、前処理・認識処理・後処理をA社認識エンジンまたはB社認識エンジンで処理。定型帳票認識エンジンでは、前処理(画像処理:傾斜補正、地紋除去、ノイズ除去、二値化など)を行った後、C社認識エンジンまたはD社認識エンジンまたは二次元コード認識で認識処理・後処理を行う。その後、帳票RPAアプリで読み取り座標照合、スコアリング(確信度算出)、ルールチェック(確信度補正)、型判定を実行。帳票RPAの管理画面では、テンプレート管理、ルール管理、アカウント管理などが可能。)

*
サービスの改良により予告なく記載されている内容が変更になることがあります。

クラウドサービスとして提供するため、柔軟に拡張可能。取り扱う帳票の数量が少量かつ複数の帳票様式を扱う業務や、特定期間に事務処理が集中する業務などの個別ニーズにも適応できます。

「業務効率化、DX推進のためにAI-OCRを活用したい」という方はもちろん、「他社のAI-OCRを導入してみたが、思うような効果が出ない」とお悩みの方も、ぜひこの機会に日立までご相談ください。