Python图像处理之识别文字(一)

本文介绍了如何使用Python结合Tesseract进行图片文字识别,并通过7行代码实现将图片文字导出为TXT文档。虽然Tesseract在识别部分字体和排列不齐的文字时存在局限,但通过调整图片特征如字体、排列和背景色,可以提高识别效果。作者还提到可以通过训练Tesseract提升识别率。
摘要由CSDN通过智能技术生成

今天意外在朋友圈看到一个朋友求助关于如何识别图片里的文字,并导出成TXT文档格式。就想到最近用Python很顺手,记得之前看到过用Python结合Tesseract就可以导出图片中的文字的,于是说干就干。

因为之前已经安装好Tesseract在电脑上,环境变量也设置好了,也用pip install了tesseract在终端上,所以就是直接敲代码的事。如果有不清楚怎么安装的朋友可以看看这位大佬的指导(OCR与Tesseract安装)先谢谢大佬的指导!

好了,进正题,其实只要7行代码就可以搞定,代码如下:
pytesseract

这里要注意记得写上编码格式,不然会报错:
UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xbb’ in position
切记!!!
然后拿到转换后的TXT文档如下右图(图片是网上随意找来实验的):
在这里插入图片描述
可见tesseract在识别图片文字方面还是有很大的进步空间的,上图只识别了其中一部分图片的文字,掌柜想说是不是排列不整齐也会影响他的识别?于是又去找了一张图来

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值