Enterprise Blue Ocean ◮

神谷町RPAブログ

  • [特集] Blue Prism の製品概要がよくわかるWebページ動画取材記事
  • [特集] Blue Prism DX にある、Blue Prismの部品一覧はこちら
  • [特集] Blue Prism でExcelを操作する記事はこちら
  • [特集] Blue Prism のベストプラクティス記事はこちら
  • Blue PrismのQ&Aを掲示板(teratail)でやりませんか?

Blue Prismの内蔵OCRで、請求書の読み取りを試みる<発動?編>

Blue Prismの内蔵OCR機能は、画面の一部を画像化して文字を読み取ることができます。

デフォルトだと、日本語がうまく読めませんでしたが、以下の記事で書いたように、ひと工夫することで日本語も読み取れるようになります。

ebo.hatenablog.com

ここまでで止めておけばいいのに、欲をかいて請求書のサンプル画像を読み取ろうとしましたが、うまくいかなかったのが前回です。

ebo.hatenablog.com

今回は、実際に紙をスキャンして、結果のイメージに対する読み取りを試してみます。

 

紙の領収書を用意してスキャンする

まず、紙の領収書を用意します。

この前、出張で神戸三宮 東急REIホテルに泊まったので、そのときの領収書を使ってみます。

www.tokyuhotels.co.jp

いやぁ、駅から直ぐで、雰囲気も良く、本当に良いホテルでした。

一階のレストランのラストオーダーが、ちょっと早かったかな。。

・・・生産年齢人口の減少、働き方改革。仕方のないことなのか。

 

。。話を戻して、紙の領収書をスキャンします。

結果の上下を除去すると、例えば以下のような画像になります。

f:id:EnterpriseBlueOcean:20181010202107p:plain

紙をスキャンした画像なので、折れ目がついてますね。

これでも、まだ大きいので、右下だけを切り取ってみます。

f:id:EnterpriseBlueOcean:20181010201409p:plain

これをBlue Prismの内蔵OCR(tesseract OCR)で読み取ってみましょう。

 

読み取り結果

読み取り結果は以下の通りです。

本来の内容 tesseract OCRの読み取り結果
お支払金額 お支払金額
33,040 33, 4
ご請求金額  
0  
(内 消費税: 内 消
2,447 2' 447

うーん、、識別精度以前に、取れたり取れなかったりしてるな。。

思った以上に奥が深いような気がしてきました。。

 

まとめ

  • 紙をスキャンした画像に対して、Blue Prismの内蔵OCRでスキャンを試みたが、識別精度だけでなく、文字が取れない部分が出てきたりしている
  • OCR、奥が深い印象です。。ここから先は、Blue Prismというより、tesseract OCRをどうするか…という話になっていく気がします
  • 次回は、オープンソースの tesseract OCR ではなく、いわゆるAI OCR(AI?キズナアイかな?)を試してみたいと思います