タイトル : Re^4: PDFファイルの画像データ内の文字列読み込み 投稿日 : 2008/05/26(Mon) 09:07 投稿者 : 出来悪くでごめんなさい
いろいろとありがとうございました。 教えて頂いた方法で、検討・調査しやってみます。 また何かありましたら、書き込みするかもしれませんので、 その際は宜しくお願い致します。 > > しかし、ちょっと精度が悪いような気がします。 > > フリーの OCR も幾つかありますが、手っ取り早く精度を上げるなら、 > 市販の OCR ソフトに頼った方が良いでしょう。認識補正の辞書の量が違いますし、 > 定型文書の場合には、レイアウトの指示を行えるものもありますので。 > > 元の文書の状態や、認識させる文書の種類などにもよるので、比較が難しい分野ですが、 > まずはプログラム制御云々を抜きにした比較論として、このあたりの情報とか。 > http://q.hatena.ne.jp/1158154829 > http://softfarm.net/info/ather/ocr_soft.html > http://mahoro-ba.net/c1-80.html > > > で、それらの試用版などを試してみて、許容できる精度のものをピックアップし、 > それらがプログラムから制御できるか否か、開発元に問い合わせてみては如何でしょう。 |