« 今日訳したニュース | トップページ | 自作PDIC用辞書に追加した単語/フレーズ »

2005年5月20日 (金)

OCRソフトは和英混在文が苦手

雅さんのBlogに「OCR、実はすごい」という内容の記事が掲載されていました。「これまで使っていたスキャナのおまけOCRは駄目だったけど、正式版にアップグレードしたらばっちり」とのことです。

僕が4年か5年前にちょこっと使った英文専用OCRソフトのTextBridgeも認識率はほぼ100%だったので、それ自体は驚きません。気になったのは、OCRソフトが苦手としていた和英混在の認識率。和文なら和文、英文なら英文に限れば優れたソフトでも、当時はことごとく使い物にならない状態だったのです。

今なら認識技術も進歩しただろうし、プロセッサの速度も上がっているから相当改善されたのだろうと思い雅さんに質問してみました。ちなみに雅さんの使っているOCRは、e.Typist v.10.0 製品版だそうです。雅さん曰く「『使える』とはお世辞にも言えませんね」。うーん、そうなんだ。

ところで、OCRによる読み込みが成功したかどうかを確認するため、目視とともに音声合成ソフトでPCに読み上げさせる、という手法を使っている方がいるようです。僕も自分の作成した文章の校正をする際には、音声合成ソフトを利用します。100%正しく読んでくれるわけではありませんが、目だけだと見落としがちな誤記や変な文章の流れを見つけるのに役立ちます。

ただ、現在使っているソフトはちょっと間抜けな誤動作をするもので、これをどうやって回避しようか探っています。詳しくはまた後日。

|

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/107532/4209250

この記事へのトラックバック一覧です: OCRソフトは和英混在文が苦手:

コメント

コメントを書く