今年の1月に株式会社ハンモック様にてOCRハンズオン研修に参加いたしました。最近、巷でRPAとともに注目されているOCRビジネスの製品の「AnyForm OCR」をISCのデモ環境にて稼働検証を実施しました。

背景・課題

お客様がご利用中のFAX受信や手書き伝票などの帳票をスキャナーなどを使用してスキャンし電子化(PDF、TIF、JPEGなど)したものや、すでに帳票から電子化されたものをAnyform OCRにて取込みデータ化して取込み精度の確認判断に伴う検証を弊社イグアスで実施しています。

一部の限られた帳票しか、OCR処理しかできなかった

従来OCRの目的は、専用帳票で手書き文字を認識することでした。
自社で帳票を設計し、印刷したものを取引先に利用してもらう必要があるため、一部の限られた帳票だけしか利用できません。

しかし、取引先は独自の基幹システムを導入しており、そこから出力される帳票(既存帳票)のレイアウトは多種多様です。
OCR活用の幅を広げるためにはこれらの帳票に対応する必要があります。

なぜ、取引先システムから出力される帳票にOCRが活用できなかったのか?

① 可変明細に対応できない。

  • 罫線の位置や長さなどの特徴を元に、OCR領域を設計します。しかし、設計した行数と異なる場合、帳票下部データでアジャストに失敗します。これによりOCR項目の認識位置がズレてしまい、正確に文字を認識ができません。

② OCR化に掛かるコスト(時間、費用)

  • 認識精度の高い帳票作成は難易度が高く、メーカーに依頼する必要があり、時間と費用がかかってしまいます。

③ 低い文字認識精度

  • 既存帳票OCRは補正が弱いため、認識精度が低いという問題がありました。
  • 特にFAX受信する帳票は、縮小や文字の擦れが発生してしまうため適しません。

製品情報

製品名:AnyForm OCR V5.1

『AnyForm OCR』は、取引先システムから出力される帳票をOCR処理します。
明細行がある帳票では、注文量に応じて行数が変更される場合があります(可変明細)。従来OCRは、文字認識する場所が特定できないこのような帳票には利用することができませんでした。

しかし、『AnyForm OCR』は独自の画像認識処理により、従来OCRの課題であった可変明細帳票へのOCR処理を可能とします。
高精度に文字を認識し、スピーディーなデータ化を実現します。

① 可変明細に対応!

独自の画像処理により、明細行の終端を認識することが可能。
注文書や納品受領書などに対するOCRの活用範囲の拡大。

② 取引先帳票のOCR化設計がかんたん

従来OCRに比べ、非定型帳票をOCR読み取りできるようにする設定が格段に簡略化。
自社でOCR帳票の設定ができるため、時間とコストを削減。

③ 高精度な文字認識率

画像補正やOCR項目を正確に認識するための仕組みにより、FAXでも正確に文字認識することが可能。

OCR検証したパターン

  • パターン1(ハンズオンサンプル帳票)
    ヘッダー項目、明細項目で固定枠有り ⇒ キーワードOCRまたは、座標OCRにて対応
  • パターン2
    ヘッダー項目、明細項目、固定枠無し ⇒ 座標OCRにて対応
  • パターン3(手書き帳票)
    ヘッダー項目、明細項目 ⇒ 座標OCRで手書き対応
  • パターン4
    ヘッダー項目が1つで、明細項目が左右2列の場合 ⇒ 座標OCR対応で明細の読み込み順序を考慮して対応※通常は上から左右の順番だが、左側の列処理後、右側の列の順番に設定可能。
  • パターン5
    ヘッダー項目と明細項目が1ページに2つずつ存在 ⇒ 2つのヘッダー要素と、明細を1つ要素として1レコード出力するイメージ。※CSV出力後、分割する作業をRPAなどで考慮が必要なので注意願います。
  • パターン6
    ヘッダー項目、明細項目が可変明細の場合 ⇒ 座標OCRで終端文字列識別にて対応※終端文字列識別にて可変明細も対応可能です。
  • パターン7
    ヘッダー項目、明細項目が非定型明細の場合 ⇒ 座標OCRで「いつものマスター」機能にて対応※「いつものマスター」とは、明細項目を固定登録表示し、数量のみを入力する形態。

※共通の認識向上処理としては、「マスター一覧」や「認識支援辞書」使用して対応。

所感

ハンモック様のハンズオン研修を約3時間程度受講することで、基本的な設計することが出来るようになります。またサポート体制もあり、質問には的確に回答いただけます。
イメージ画像の傾き、文字の大きさや濃さにも柔軟に対応されているが補正機能で問題はありません。
認識支援辞書やマスター一覧機能により、さらに認識率を解消できること。
ベリファイ画面では、誤認識のコードの場合、修正入力しマスター一覧を参照して関連情報を入力することなく展開されます。
働き方改革の観点から、1から入力した作業に比べれば作業効率化が図れると考えます。
また、OCR機能で出力されたデータをRPAと連携して、基幹システムへのデータエントリー処理の連携自動化することでさらに効率化が見込まれると考えます。

※AnyForm OCR + AutoMate 連携イメージ

AnyForm OCR + AutoMate 連携イメージ

資料ダウンロード