基于python的图像识别_基于PYTHON的图片文字识别

文本资料的图像文件进行分析识别处理,

获取文字及版面信息的过程。

一般包括

以下几个过程:图像输入、图像前处理、预识别:

1

图像输入:

对于不同的图像格式,

有着不同的存储格式,

不同的压缩方式,

目前有

OpenCV、CxImage

等开源项目。

2

预处理:主要包括二值化,噪声去除,倾斜较正等。

2.1

二值化:

对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于

图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好

地识别文字,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景

信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图。

2.2

噪声去除:

对于不同的文档,我们对噪声的定义可以不同,根据噪声的特征进行去燥,

就叫做噪声去除。

3

倾斜校正:由于一般用户,在拍照文档时,都比较随意,因此拍照出来的

图片不可避免的产生倾斜,这就需要文字识别软件进行较正。

4

版面分析:将文档图片分段落,分行的过程就叫做版面分析,由于实际文

档的多样性,复杂性,因此,目前还没有一个固定的,最优的切割模型。

5

字符切割:由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限

制了识别系统的性能。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值