OCRソフトの比較

我が家には溜め込みまくった料理雑誌がたくさん。
捨てたいんだけどおいしそうなレシピのってるし…、と
捨てられずに今まできた。
でも、積んでるだけじゃ結局無駄!
整理整頓することに。


思い切ってばっさり捨てようかと思ったんだけど、
必要なレシピは取っておくことにした。(余計整理が進まない気もするが)
スクラップにすることも考えたけど、
冷蔵庫にある材料からレシピを探したり、漠然と洋食のサイドメニューとかで探したいこともある。
PCから検索できたほうが便利!


ということで、デジカメで写真に撮りOCRソフトでデータ化するのはどうかと考えた。
有名どころをピックアップし、3つのソフトを比較してみた。
目的は、オレンジページの記事をOCR読み込みできるか。
テキストベースでレシピ管理するという用途に向くかどうか。

読取革命Ver.12 製品版

読取革命Ver.12 製品版

  
・画像編集の種類が多い。シャープネス、減色など。
・背景に画像があったりすると識字率があまりよくない…。
・まともな日本語にならないほうが多かった。
読んde!!ココ Ver.13

読んde!!ココ Ver.13

  
・画像編集をすると白黒画像になる。
白字は読み取りにくい。
・背景に画像があっても識字率はよい。
・認識結果の結合、再分割機能が使いやすい。
e.Typist v.12.0 製品版

e.Typist v.12.0 製品版

  
・樽型歪み補正があり、ゆがみ補正時のグリッド表示がありがたい。
・背景の画像に惑わされる場合もあるが、識字率はよい。
・認識結果の結合、再分割機能がつかいやすく、縦方向の分割にも対応している。


試してみたところ、「読んde!!ココ」と「e.Typist」が使いやすかった。
デジカメ画像からの取り込みなので、画像編集の種類が多い「読取革命」も魅力的だったが、
識字率がイマイチだったので今回は対象から外した。
最終的に選んだのは「読んde!!ココ」。


決め手になったのは、レシピに良くある

 鶏もも肉・・・・・・・・・・・1枚(200g)
 玉ねぎ ・・・・・・・・・・・1/2個

という表記の、「・・・・」部分。
「読んde!!ココ」だと、・・・や空白で埋めるなりして、鶏もも肉と1枚がテキストの同じ行になり

 鶏もも肉      1枚(200g)
 玉ねぎ      1/2個

こんな感じで出力されるのだが、「e.Typist」では

鶏もも肉
玉ねぎ
1枚(200g)
1/2個

というように別の行になってしまう。自動で枠を設定するためらしい。
きちんと設定すれば読み取れるだろうし、「e.Typist」の歪み補正機能が魅力的だったのだが
大量に読み込むことを考えると、いちいち修正するのは大変かなー。


次は読み込んだ情報を整理整頓する術についてまとめる予定。