- 調査・研究
人工知能による画像認識で業務効率化にトライ①
会社の休憩室で雑談していた時、契約管理部門の担当者から「紙の書類を自動的に読み取って、内容をデータとして管理できる方法はないかな?」と相談がありました。
詳しく話を聞くと、「取引先各社から届いた紙の契約書などをスキャナで読み込み、そのファイルを自動で格納し、内容を台帳(Excel)に転記できないか」とのことでした。
今は紙の書類をスキャナで読み込み、書類の内容を台帳に転記するまでを全て人が行っているので、時間がかかる上にたまにミスがあるそうです。
スキャナで読み込んだ書類の画像を人工知能(ディープラーニング)の画像認識を使って、取引先や書類の種類などを判断することが出来れば、書類の仕分けや台帳への転記を自動化することができ契約管理部門の作業効率化のお役に立てるかもしれないと思いトライしてみることにしました。
※以下、「人工知能(ディープラーニング)」を「人工知能」と記します
【実装イメージ】
実装方法としては学習と分類に分けることができます。
事前準備(学習)編
①既にスキャナで読み込んである書類の画像をあらかじめ以下のようなフォルダ構成で格納する
②人工知能を使い、過去の書類画像を学習させる
上記フォルダごとに格納されている画像を読み込み、人工知能で画像解析を行い、’書類の見た目’をフォルダごとに学習させる。
仕分け(分類)編
- 取引先から届いた書類をスキャナで取り込んで画像にし、
その画像ファイルを学習済の人工知能に読ませて、格納先を確定する - 格納先が確定したら、画像ファイルを確定したフォルダに自動で移動する
- 移動させる際に、台帳(Excel)に取引先名や書類名を自動で転記する
- 画像ファイルから 契約名・契約番号等を取得し、台帳(Excel)に追記する
ここまで出来れば、契約管理部門の作業がすごく軽減される・・・と思い実装してみましたが、④がどうにも難しいです。
GoogleのOCRサービスなどを使えば上手くできそうだけど、
-
書類画像から、契約名や契約番号等が書かれている場所を特定するのはどうするか・・・
-
フォーマットが変わらなければ、個別に対応すれば何とかなるかな・・・
(画像ファイルが格納されているフォルダに設定ファイルのようなものを置いとくとか) - 書類の一部情報をAPIに投げるのってどうなんだろう・・・
等々、悶々としてしまい、仕分け編の③までは何とかできるかなというところまでは確認できましたが、④はまだ実装できていません。引き続き、試行錯誤しながらトライしていきたいと思います。
まだ途中までしかトライできていませんが、人工知能の画像識別は意外と色んなところで使える気がしています。
(次回に続く)