最近一个月在做互联网横幅图片中OCR的提取与矫正,主要是针对红色横幅体,在项目实践过程中遇到了一些问题,多亏了老师的帮助,基本完成了项目。现在分享一下我用到的一些方法,希望对大家有用。字符识别第二版
字符识别第二版
一、系统概况:
系统主要有三部分构成:横幅分割,横幅校正,字符识别。
横幅分割:本系统主要是针对红色横幅体进行分割识别,在图片中横幅体的主要特征是颜色,将图像转换到YCbCr空间,对Cb和Cr分量设定阈值,将图像转化为二值图。横幅体的形状一般是矩形,面积在图像中占据一定的比例,而且长宽比有一定的规律,一般长宽比大于3:1。对二值图像进行连通域分析,取连通域面积较大的前三个连通域,这三个连通域中长宽比大于3:1且最佳外接多边形与矩形相似的为横幅区域。
横幅校正:1、横幅是否矫正的判定:首先确定横幅体的