OCRソフトの比較
我が家には溜め込みまくった料理雑誌がたくさん。
捨てたいんだけどおいしそうなレシピのってるし…、と
捨てられずに今まできた。
でも、積んでるだけじゃ結局無駄!
整理整頓することに。
思い切ってばっさり捨てようかと思ったんだけど、
必要なレシピは取っておくことにした。(余計整理が進まない気もするが)
スクラップにすることも考えたけど、
冷蔵庫にある材料からレシピを探したり、漠然と洋食のサイドメニューとかで探したいこともある。
PCから検索できたほうが便利!
ということで、デジカメで写真に撮りOCRソフトでデータ化するのはどうかと考えた。
有名どころをピックアップし、3つのソフトを比較してみた。
目的は、オレンジページの記事をOCR読み込みできるか。
テキストベースでレシピ管理するという用途に向くかどうか。
|
・画像編集の種類が多い。シャープネス、減色など。 ・背景に画像があったりすると識字率があまりよくない…。 ・まともな日本語にならないほうが多かった。 |
|
・画像編集をすると白黒画像になる。 白字は読み取りにくい。 ・背景に画像があっても識字率はよい。 ・認識結果の結合、再分割機能が使いやすい。 |
|
・樽型歪み補正があり、ゆがみ補正時のグリッド表示がありがたい。 ・背景の画像に惑わされる場合もあるが、識字率はよい。 ・認識結果の結合、再分割機能がつかいやすく、縦方向の分割にも対応している。 |
試してみたところ、「読んde!!ココ」と「e.Typist」が使いやすかった。
デジカメ画像からの取り込みなので、画像編集の種類が多い「読取革命」も魅力的だったが、
識字率がイマイチだったので今回は対象から外した。
最終的に選んだのは「読んde!!ココ」。
決め手になったのは、レシピに良くある
鶏もも肉・・・・・・・・・・・1枚(200g)
玉ねぎ ・・・・・・・・・・・1/2個
という表記の、「・・・・」部分。
「読んde!!ココ」だと、・・・や空白で埋めるなりして、鶏もも肉と1枚がテキストの同じ行になり
鶏もも肉 1枚(200g)
玉ねぎ 1/2個
こんな感じで出力されるのだが、「e.Typist」では
鶏もも肉
玉ねぎ
1枚(200g)
1/2個
というように別の行になってしまう。自動で枠を設定するためらしい。
きちんと設定すれば読み取れるだろうし、「e.Typist」の歪み補正機能が魅力的だったのだが
大量に読み込むことを考えると、いちいち修正するのは大変かなー。
次は読み込んだ情報を整理整頓する術についてまとめる予定。