2018年1月20日土曜日

ニコ生ミラー補助ツール

n番煎じですが、作ってみたかったので作ってみました。
ニコ生だけでなく、Twitch、Youtube、Mixerも同一ウィンドウ内に表示できます(埋め込みコードの取得が必要)
音声ON/OFF、ラベルの添付も。要するにRTAのミラーに特化?した?ツールです。対応プラットフォームが上記のみなのもそういうことです。



こういうの作ったよっていう報告記事なので、適当ですがこれくらいで。

2018年1月11日木曜日

OCR精度確認

OCRソフトの認識精度チェック

使用したソフト
・Capture2Text
・GT Text
・Panasonic 読取革命 15
・Google Cloud Platform - VisionAPI Text Detection
・Office Lens(字幕のみ)

検証方法
様々なフォントで書かれた文字、ゲームの字幕を各OCRソフトで認識させる。
前者は単純な認識精度、後者は背景が単色ではない場合の認識精度を見る。

フォントの種類:207種類
フォントサイズ:8,12,16pt
文字列:ABCDE FGHIJ KLMNO PQRST UVWXYZ 12345 67890

連結させた画像を読み取る。
利用させていただいたサイト:全標準フォント一覧 / フォントシミュレーター
http://dekasu.net/fonts/

































ゲーム一覧
Ori and the Blind Forest
Crypt of the NecroDancer
Rabi-Ribi
Getting Over it
ICEY

連結させた画像を読み取る。


















結果:

概要

8pt12pt16pt
読取革命1.964.524.96
Capture2Text4.145.315.54
GT text2.594.975.30
GCP5.946.606.74
※スペースで区切られた文字がそれぞれ正確に認識されているか。
スコアは各0~7。全てのフォントに対するスコアの平均を表に示している。


フォントに関してはGoogle Cloud Platform 1強、字幕に関してはGCP、Office Lensが抜きん出ている。全体的にGCPがより優秀。

Capture2Text、GT Textについては余白を限りなく減らせば多少認識精度が上がったが、上記ソフトには及ばない。

使い勝手諸々を考慮すると、今回検証した中ではCapture2Textが良さそう。
GCPはプログラムを組む必要がある、一定以上の利用は有料の為、少し頑張らないといけない。リアルタイムで使用する必要がなければ、Googleドキュメントに画像を読み込ませれば同様のことが可能。

(今回GCPのプログラムは以下のようにした(サンプルコードをVB.netに書き換えただけ))

 Dim image As Image = Image.FromFile("ファイルパス")
        Dim client As ImageAnnotatorClient = ImageAnnotatorClient.Create
        Dim response = client.DetectDocumentText(image)
        Dim count As Integer = 0

        For Each page In response.Text
            If count = 0 Then
                Textbox1.AppendText(response.Text)
                count = 1
            End If

        Next







スマホからテスト

メインブログに雑言を書くのもどうかなーと思い、bloggerにダラダラ書いていこうということで。 相変わらず書き始めで詰まるんですが、最近は体の歪みを少しでもとっていこうと一人でちまちまストレッチなどをしています。矯正したいのはO脚、外反母趾、内反小趾あたり(整体に行くべきなんだ...