一般社団法人経営情報学会-2018年秋季全国研究発表大会

大会プログラム

CNNを利用した画像内文字認識の精度向上方法の提案

○手塚 毬花1)喜多村 正仁1)

1) 千葉工業大学

Abstract
近年、画像処理研究で主に利用され高い精度が評価されているのがConvolution Neural Network (CNN) である。本研究は、特殊フォントを含む文字列やさまざまな情景画像から正確な文字領域の抽出と認識を行う方法を提案することを目的とする。そのために既存のデータセットであるMNIST以外に、特殊フォントを含む画像データセットを作成した。CNNによる文字認識を行い、それぞれの精度を比較した。この結果において、誤りの多い文字を確認し、上記データセットに精度向上のための学習データを追加したのち、再び文字認識を行い、精度向上を確認した。

In recent years, Convolution Neural Network (CNN) is mainly used for image processing and evaluated with high accuracy. The purpose of this research is to propose a method to extract and recognize accurate character areas from character strings including special fonts and various scene images. Therefore, in addition to MNIST which is an existing data set, an image data set including a special font was created. Character recognition by CNN was made, and the accuracy of the both datasets was compared. After checking characters with errors, and adding learning data for accuracy improvement to the above data set, accuracy improvement was confirmed.
Keywords
CNN,画像処理,文字認識

CNN,image processing,character recognition