タイトル : Re^3: PDFファイルの画像データ内の文字列読み込み 投稿日 : 2008/05/23(Fri) 20:45 投稿者 : 魔界の仮面弁士
> しかし、ちょっと精度が悪いような気がします。 フリーの OCR も幾つかありますが、手っ取り早く精度を上げるなら、 市販の OCR ソフトに頼った方が良いでしょう。認識補正の辞書の量が違いますし、 定型文書の場合には、レイアウトの指示を行えるものもありますので。 元の文書の状態や、認識させる文書の種類などにもよるので、比較が難しい分野ですが、 まずはプログラム制御云々を抜きにした比較論として、このあたりの情報とか。 http://q.hatena.ne.jp/1158154829 http://softfarm.net/info/ather/ocr_soft.html http://mahoro-ba.net/c1-80.html で、それらの試用版などを試してみて、許容できる精度のものをピックアップし、 それらがプログラムから制御できるか否か、開発元に問い合わせてみては如何でしょう。 |