OCRソフトの認識精度チェック
使用したソフト
・Capture2Text
・GT Text
・Panasonic 読取革命 15
・Google Cloud Platform - VisionAPI Text Detection
・Office Lens(字幕のみ)
検証方法
様々なフォントで書かれた文字、ゲームの字幕を各OCRソフトで認識させる。
前者は単純な認識精度、後者は背景が単色ではない場合の認識精度を見る。
フォントの種類:207種類
フォントサイズ:8,12,16pt
文字列:ABCDE FGHIJ KLMNO PQRST UVWXYZ 12345 67890
ゲーム一覧
Ori and the Blind Forest
Crypt of the NecroDancer
Rabi-Ribi
Getting Over it
ICEY
連結させた画像を読み取る。
結果:
概要
| 8pt | 12pt | 16pt |
読取革命 | 1.96 | 4.52 | 4.96 |
Capture2Text | 4.14 | 5.31 | 5.54 |
GT text | 2.59 | 4.97 | 5.30 |
GCP | 5.94 | 6.60 | 6.74 |
※スペースで区切られた文字がそれぞれ正確に認識されているか。
スコアは各0~7。全てのフォントに対するスコアの平均を表に示している。
フォントに関してはGoogle Cloud Platform 1強、字幕に関してはGCP、Office Lensが抜きん出ている。全体的にGCPがより優秀。
Capture2Text、GT Textについては余白を限りなく減らせば多少認識精度が上がったが、上記ソフトには及ばない。
使い勝手諸々を考慮すると、今回検証した中ではCapture2Textが良さそう。
GCPはプログラムを組む必要がある、一定以上の利用は有料の為、少し頑張らないといけない。リアルタイムで使用する必要がなければ、Googleドキュメントに画像を読み込ませれば同様のことが可能。
(今回GCPのプログラムは以下のようにした(サンプルコードをVB.netに書き換えただけ))
Dim image As Image = Image.FromFile("ファイルパス")
Dim client As ImageAnnotatorClient = ImageAnnotatorClient.Create
Dim response = client.DetectDocumentText(image)
Dim count As Integer = 0
For Each page In response.Text
If count = 0 Then
Textbox1.AppendText(response.Text)
count = 1
End If
Next