GUI的基本模块:选择图片,识别图片,还有重置
点击选择图片
点击识别图片
点击重置,所有的信息被删除
识别的基本思路:建立识别库,然后把需要识别的图片和识别库的图片对比,最后根据对比的结果输出,把结果输出到界面,同时保存到txt文件中。
关于建立识别库,就是建立了汉字的图片。
数据库的数据要求保证每个图片的格式大小一致,我们建立了一个模板文件,14个中文字符都保存在里面,
对于导入的图片,考虑到我们要提取的信息出版社一般在书的下方,为了减少误判,我们把图片人为裁剪一部分,
对图片进行灰度处理,裁剪,同时采用灰度阈值,去除像素小于30的目标点,
对于提取出来的信息,还需要分段识别信号,采用了等间隔分段的放发,提取出了7个子图片,
针对提取出来的图片和自己建立的数据库,做对比,相关系数最高的,我们认为是该文字,
(网上的方法,我直接截图了)
代码实现:
comp=zeros(1,num_letras);
for n=1:num_letras
sem=sum(sum(abs(double(~templates{1,n})-double(imagn))));
comp(n)=sem;
end
vd=find(comp==max(comp));
企q鹅q号:1762016542