数字图像处理笔记(七) 字符串识别

前言

  看了某年的真题,发现要考字符串识别,要画流成图和描述用到的数字图像处理方法,所以就自己用tikz画了一个,顺便用写了写自己的想法,主要参考了一篇中科大的硕士论文。

流程图

\documentclass[UTF8,fontset=macnew]{ctexart}
\usepackage{tikz}
\usepackage{amsmath}
\usepackage{xcolor}
\usepackage{lipsum}
\usepackage{tcolorbox}
\usetikzlibrary{positioning}
\usetikzlibrary{shapes.geometric}
\usetikzlibrary{arrows,arrows.meta}
 \tikzstyle{lingxing} =  [fill = yellow!30,diamond,draw,shape aspect = 2,inner sep = 0.4pt,thick,line width = 0.5pt]
 \begin{document}
     \begin{tikzpicture}
   		\begin{scope}[node distance = 1 ]
   			\node(start)[rectangle,draw,fill=white] at (5,7){输入图像};
   			\node(erzhi)[rectangle,draw,fill=white] at (3,5){灰度图};
   			\node(erzhi2)[rectangle,draw,fill = white] at (7,5){灰度图};
   			\node(kong)[fill =white] at (5,6){ };
   			\node(kong2)[fill=white] at (5,4){ };
   			\node(erzhihou)[rectangle,draw,fill=white] at (5,2.5){二值化后的图像};
   			\node(quzao)[rectangle,draw,fill=white] at(5,1){去噪后的图像};
   			\node(shibie)[lingxing,draw,fill=white] at(5,-1){识别后的字符};
				
  			\draw[-] (start.south) -- node[above,xshift = 1.5em,yshift=-1em,font=\small]{彩色图?}(kong.center);
   			\draw[->]  (kong.center) -| node[above,yshift=-1.8em,xshift =1.4em,font=\small]{Y rgb2gray}(erzhi.north);
  			\draw[->] (kong.center) -| node[above,yshift=-1.8em,xshift=-0.5em,font=\small]{N}(erzhi2.north);
  			\draw[-](erzhi.south) |-  (kong2.center);
  			\draw[-](erzhi2.south)  |-  (kong2.center);
  			\draw[->](kong2.center)  -- node[above,font=\small,yshift=-0.7em,xshift=2.2em]{ostu阈值}(erzhihou.north);
  			\draw[->](erzhihou.south) -- node[above,font=\small,xshift=1.2em,yshift = -1em]{去噪}(quzao.north); 
  			\draw[->](quzao.south) --  node[above,font=\small,xshift=1.2em,yshift = -1em]{识别}(shibie.north);
  		  		\end{scope}
     \end{tikzpicture}

\end{document}

在这里插入图片描述
描述
在这里插入图片描述
看这张图有很多点噪声和线噪声,在一定程度上这个"2"字甚至有些斜,可能提取出来之后做一次旋转变换识别效果可能才好。
在这里插入图片描述

今天学了10小时贼舒坦,当时梦良聊完天之后释怀了,保研是件顺其自然的事情,不如现在专心准备考研,哈哈哈!

参考文献

1.王璐. 验证码识别技术研究[D]. 中国科学技术大学.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
汽车车牌定位与字符识别 一、 实验目的: 1、巩固理论课上所学的知识。 2、锻炼动手能力、激发研究潜能,增强理论联系实际的能力。 二、 设计原理与步骤: 定位汽车车牌并识别其中的字符,采用Matlab平台提供的一些图像处理函数,以傅立叶变换通过字符模板与待处理的图像匹配为核心思想。基本方法如下: 1、读取待处理的图像,将其转化为二值图像。 2、去除图像中不是车牌的区域。 3、为定位车牌,将白色区域膨胀,腐蚀去无关的小物件,包括车牌字符。 4、此时车牌所在白色连通域已清晰可见,但一个更大的连通域将车牌所在连通域包围了,需将其填充。 5、查找连通域边界。同时保留此图形,以备后面在它上面做标记。 6、找出所有连通域中最可能是车牌的那一个。 判断的标准是:测得该车牌的长宽比约为X:1,其面积和周长存在关系:(X×L×L)/(2×(X+1)×L)2≈1/Y,以此为特征,取metric=Y*area/perimeter^2作为连通域的匹配度,它越接近1,说明对应的连通域越有可能是X:1的矩形。 7、将车牌图像反白处理,并扩充为256×256的方阵,以便傅立叶变换中矩阵旋转运算的进行。 8、从文件读取一个字符模板。对图像计算傅立叶描述子,用预先定义好的决策函数对描述子进行计算。变换后的图像中,亮度的高低指示相应区域与模板的匹配程度。 9、确定一个合适的门限,显示亮度大于该门限的点,也就是与模板的匹配程度最高的位置。 10、对照图片,可以说明相应字符被识别和定位了。 三、 实验记录及分析: 待处理的图像如下所示。图像整体比较清晰干净,车牌方向端正,字体清楚,与周围颜色的反差较大。读取待处理的图像,将其转化为二值图像。 经试验,采用门限值为0.2附近时车牌字符最为清楚,杂点最少。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值