EvernoteとGoogle documentのOCR機能を比べてみる(中国語) その2 - スキャナの解像度はあんまり関係ない

今回の記事は短いですし、役立つ情報はありません。ちょっとした続報だけです。

前回、このお題で記事にしたときには、スキャナの解像度は(その機会でデフォルトの)300dpiで試して、Evernoteは残念ながら全滅、Google Documentは漢字の部分は、まあまあそこそこだったものの、ピンインになるとガクッと解析能力が落ちるというお話でした。

じゃ、解像度を上げたらどうなるかというのを昨日やっと実験することが出来ました。解像度を600dpiに上げて似たようなテキストをスキャンしてみました。

で、気になる結果の方ですが・・・。

Evernoteは相変わらずダメ。Searchable PDFとして出力しても内容は真っ白。一方、前回多少なりとも結果を残したGoogle Documentの方に読み込ませたところ、結果はほとんど変化なし、むしろ多少精度が落ちていました。

おそらくですが、解像度を上げるとその分正しい認識には必要ない「ノイズ」もいっぱい拾ってしまうということなんだと思われます。

簡単じゃないですね。