tagCANDY CGI VBレスキュー(花ちゃん)の Visual Basic 6.0用 掲示板
VBレスキュー(花ちゃん)の Visual Basic 6.0用 掲示板
[ツリー表示へ]  [ワード検索]  [Home]

タイトル Re^3: PDFファイルの画像データ内の文字列読み込み
投稿日: 2008/05/23(Fri) 20:45
投稿者魔界の仮面弁士
> しかし、ちょっと精度が悪いような気がします。

フリーの OCR も幾つかありますが、手っ取り早く精度を上げるなら、
市販の OCR ソフトに頼った方が良いでしょう。認識補正の辞書の量が違いますし、
定型文書の場合には、レイアウトの指示を行えるものもありますので。

元の文書の状態や、認識させる文書の種類などにもよるので、比較が難しい分野ですが、
まずはプログラム制御云々を抜きにした比較論として、このあたりの情報とか。
http://q.hatena.ne.jp/1158154829
http://softfarm.net/info/ather/ocr_soft.html
http://mahoro-ba.net/c1-80.html


で、それらの試用版などを試してみて、許容できる精度のものをピックアップし、
それらがプログラムから制御できるか否か、開発元に問い合わせてみては如何でしょう。

- 関連一覧ツリー をクリックするとツリー全体を一括表示します)

古いスレッドにレスはつけられません。