9 月
30
オープンソースのOCRエンジン、Tesseract-OCRを試す
元の開発はHP、現在はGoogleが公開しているオープンソースのOCRエンジンです。
Windows版、Linux版それぞれ公開されており、今回はWindows版を試してみることにしました。
ダウンロードはこちら Tesseract-OCR
実験に使用したのは、4桁の数字。以下のような画像。
4桁の数字で、角度が変わっていたり、ノイズが入っていたりの画像です。
早速読み取ってみましたが、全く別の文字になって出力されました。
説明を読んでみると、文字種の指定ができるそうで。
これで数字のみと指定し20回ほど読み取ってみると、5回ほど読み取りに成功。
ただ、空白が入ったりしていましたが。
さらに説明を読んでみると、フォントや文字の開始位置終了位置等を設定できる学習機能があり、それらを利用して読み取り率を向上させることで認識率を上げられるようです。
文章を手書きすること自体が減ってきおり、活用する場面はなかなか思いつきませんが、面白い技術ですので色々と実験してみたいと思います。