2015年08月21日

tesseract-OCRで遊んでみる

測定器などの画面表示から測定データを記録したい場合、目で見て紙に書いても良いのですが、
WEBカメラでキャプチャしてOCRをかければ自動化出来そうです。
実際にやってみました。

tesseract-ocr.JPG

画像関係は、何故かVBよりもC#の方がサンプルが豊富です。
キャプチャに関しては下記サイトのプログラムをベースにしました。
http://shokai.org/blog/archives/1546

左にプレビューを表示させて、真ん中にキャプチャします。
これを、右クリックと左クリックで2点の座標を指定し、
右側にトリミングして
http://dobon.net/vb/dotnet/graphics/triming.html
明るさ、ガンマを調整して
http://dobon.net/vb/dotnet/graphics/setgamma.html
OCRにかけます。

OCRは「Tesseract ocr」という画像認識ライブラリを
C#からも扱えるようにしたラッパがあったので、下記サイトを参考に使いました。
http://whoopsidaisies.hatenablog.com/entry/2013/12/16/174819

7セグメント用の学習データは、githubに公開されていました。
https://github.com/arturaugusto/display_ocr

これを
public string tessdataLanguage = "letsgodigital";
といった感じで学習データに指定してOCRをかけたところ、無事に読み取ってくれました。

OCRの読み取りモードは、Tesseract.PageSegModeで指定していて
Auto や SingleWord, SingleLine 等がありましたが、SingleLineが一番成績が良いようでした。
posted by MON at 00:47| Comment(0) | TrackBack(0) | 日記 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
【今是昨非】http://nomulabo.com/