2015年08月21日

tesseract-OCRで遊んでみる

測定器などの画面表示から測定データを記録したい場合、目で見て紙に書いても良いのですが、
WEBカメラでキャプチャしてOCRをかければ自動化出来そうです。
実際にやってみました。

tesseract-ocr.JPG

画像関係は、何故かVBよりもC#の方がサンプルが豊富です。
キャプチャに関しては下記サイトのプログラムをベースにしました。
http://shokai.org/blog/archives/1546

左にプレビューを表示させて、真ん中にキャプチャします。
これを、右クリックと左クリックで2点の座標を指定し、
右側にトリミングして
http://dobon.net/vb/dotnet/graphics/triming.html
明るさ、ガンマを調整して
http://dobon.net/vb/dotnet/graphics/setgamma.html
OCRにかけます。

OCRは「Tesseract ocr」という画像認識ライブラリを
C#からも扱えるようにしたラッパがあったので、下記サイトを参考に使いました。
http://whoopsidaisies.hatenablog.com/entry/2013/12/16/174819

7セグメント用の学習データは、githubに公開されていました。
https://github.com/arturaugusto/display_ocr

これを
public string tessdataLanguage = "letsgodigital";
といった感じで学習データに指定してOCRをかけたところ、無事に読み取ってくれました。

OCRの読み取りモードは、Tesseract.PageSegModeで指定していて
Auto や SingleWord, SingleLine 等がありましたが、SingleLineが一番成績が良いようでした。
posted by MON at 00:47| Comment(2) | TrackBack(0) | 日記 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
はじめまして。
C#でtesseract-OCRを使ったアプリを開発したく検索しているところに、ピッタリの事例が載っておりコメントさせて頂きました。
古い記事への質問で申し訳ありませんが、可能であればサンプルソース等ご教示頂けないでしょうか?
よろしくお願いします。
Posted by yunta at 2024年05月28日 22:47
yunta 様

コメントありがとうございます。
ストレージ内を探したところ、幸いなことにプロジェクトフォルダが残っていました。
中身はネット上の情報を寄せ集めたものなので公開は差し控えますが、
7m4mon アット gmail.com
にメールを下されば、プロジェクトファイル一式をご提供可能です。
ご連絡をお待ちしています。
Posted by mon at 2024年05月28日 23:47
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
【今是昨非】http://nomulabo.com/