z.com

話題の人力OCRなレシート家計簿「Dr.Wallet」は本当に高精度なのか比較検証してみた

先週iPhone版が登場した家計簿アプリ「Dr.Wallet」が、様々なサイトで取り上げられて話題になっています。「レシートを撮影すると自動で家計簿を付けられる」という、最近話題なジャンルのアプリなんですが、「Dr.Wallet」の特徴は、データ化が人間の力で行われること。iTunesストアにある他のアプリは、写真を撮ると機械が文字を読み取ってデータ化する仕組み(こういう仕組みのことを「OCR」と言います)なんですが、「Dr.Wallet」は、データ化を人力で行う仕組みです。「だからデータ化の精度が高い!」と話題になっているわけです。

全自動の無料家計簿ドクターウォレット - レシート撮るだけ簡単、支出管理で節約、貯金
最も入力が簡単な無料家計簿・家計簿アプリ[ドクターウォレット]

人力で読み取る必要ってあるの??

しかし、まずよく分からないのは、「そもそも機械のOCRって本当に精度が悪いの?」ということです。機械OCRの精度が十分なのであれば、「機械でも人力でも、別にどっちでも…」って感じですよね。
そこで、機械式OCRと「Dr.Wallet」の精度を、ガチで比較して検証することにしました!

機械式OCRのアプリは、どれも精度が同じ

「Dr.Wallet」のライバル、機械式OCRのアプリは、iTunesストア上でいくつも公開されています。「どれを相手に比較しよう」と思い、特に精度が高いアプリを探してみました。しかし実は、どのアプリも、レシート読取精度は基本的に変わりません。ほとんど全てのアプリが、同じ「株式会社アイエスピー」という会社の読取技術を使っているからです。

アイエスピーの技術は、「ReceReco」「Zaim」など他社の家計簿アプリにも採用されている。
レシート撮影するだけの家計簿アプリにDNPが参入 「レシーピ!」 – ITmedia ニュース

(また、「レシート解析エンジン | 株式会社アイエスピー」にも情報がありました。)
実際、いくつか試してみましたが、どのアプリを使っても、読取精度に違いを感じることはできませんでした。
そこで、機械式OCRの代表を「ReceReco」として、人力OCRの代表である「Dr.Wallet」と、「機械vs人間の戦い」という形で比較してみます!

レシートをiPhoneカメラで撮影して読み取り

機械式OCRの「ReceReco」も、人力OCRの「Dr.Wallet」も、基本的な操作方法は同じです。アプリを開いてカメラを起動し、レシートを撮影すると、そのレシート内の品目や値段などが自動でデータ化されます。違うのは、「データ化」を機械が行うか人間が行うか、という点ですね。

しかし実際に何度も実験していて気付いたのは、「Dr.Walletの方が撮影もラク」ということでした。機械式OCRだと、「なるべくレシートを平行に」「この明るさで足りるかな?」なんて気を遣う必要があるんです。「ReceReco」も、最初に起動した時に左の画面で注意してきますし、実際、ちょっとレシートが斜めになると全然データを読み取ってくれなくなるんです。
「Dr.Wallet」の場合、「どうせ人間が読み取るんだから」と、結構いい加減に撮影できちゃいます。手ブレに気をつけるくらいですね。
数字にはしにくい違いですが、「撮影時にどのくらい気を遣うか」というのが、機械式OCRと「Dr.Wallet」では段違いだな、と思いました。

レシート読み取りの精度を比較!

撮影の後はレシート読み取りです。機械式OCRの場合はiPhoneアプリが自動で読み取りを行いますし、「Dr.Wallet」だと写真が送信され、人の力でデータ化されます。その分、データ化まで時間がかかるのが弱点なのですが、実は今回の実験中、データ化にかかった時間は、5-30分でした。「たまたま空いている時間帯だった」ということなのかもしれませんが、少なくとも、寝る前に撮影しておけば、遅くとも翌日昼くらいには確実にデータ化されそうです。
実際には10枚のレシートで試したのですが、スペースの都合上、3枚分を紹介しましょう。

予想していましたが、やはり機械式OCR(左)は、「ス」と「ヌ」などの文字や、漢字に弱いです。「ビジネス書」がこんなことになってしまいました…。「Dr.Wallet」はきちんと読み取りできています。人間がこんなミスをするわけがないので当たり前ですが。

機械式OCRが読み取りを間違えている場合は自分で修正する必要があって、大体1品目につき10秒くらいかかります。時間もロスですし、単純に、面倒です…。

レシートによっては、機械式OCRでは全く品名が意味不明になってしまうこともありました。これ、実際に使う場合は結構困りそうですね。データをその場で自分で修正しないと、後で見返したときに「これ何のレシート??」ってなってしまいそうです。

ある程度品名が多いと、カタカナだけであっても、機械式OCRでは「完璧!」ということはまずないです。大体1箇所か2箇所間違ってます。「Dr.Wallet」では、まず「間違い」はありません。

今回の比較検証結果

ということで、10枚のレシートで実験した結果です。
上に載せた星乃珈琲みたいに、「品名が全く意味不明」という場合は「0文字 / 正しい文字数」というように数えました。

機械式OCR(ReceReco)人力OCR(Dr.Wallet)
正しく読み取れた文字数140/173172/173
完璧に読み取れた品名16/3231/32
完璧に読み取れたレシート2/109/10

正直言って、こんなに差が付くとは思っていませんでした。「文字数」なら機械式OCRも、80%ちょっとで結構頑張ってるんですけど、「品名のどこかがおかしい」「レシートのどこかがおかしい」ということが、かなりの確率であるんです。どこか1箇所おかしいだけでも、結局自分で修正しなくちゃいけないので、正直言って、面倒です…。

ちなみに、「Dr.Wallet」が唯一ミスをしたのは、上にも載せた星乃珈琲でした。アイスコーヒーの「I コーヒー」が「コーヒー」になってました。「I」を人間が見逃したんですね、たぶん。

執筆:NRK

 

投稿日時2013年09月10日17時00分 | カテゴリー: アプリ | このエントリーをはてなブックマークに追加

関連記事

最新記事

▲TOP