python 图片识别_Google Tesseract OCR图片文字识别应用案例(附Python源代码)

本文介绍了使用Python调用Tesseract OCR库进行图片文字识别的方法,包括安装、配置和基本使用。通过示例展示了对英文、中文和日文的识别效果,指出Tesseract在标准字体和高清图片上的识别率很高,但不支持手写文字和低质量图片。
摘要由CSDN通过智能技术生成

df4e5e3130552a2fc96a9bef43198674.png

OCR(Optical Character Recognition,光学文字识别)是一种将图片上的不可处理的文字信息转成可处理的文字信息的技术。而目前可以实现OCR的底层库并不多,很多第三方的库或软件服务公司都是在使用共同的几个底层OCR库,或者是在这些底层OCR库基础上进行定制。

Tesseract 是一个开源的OCR库,由HP实验室开发由Google维护(Google 也是一家以OCR 和机器学习技术闻名于世的公司)。除了极高的精确度,Tesseract 也具有很高的灵活性,我们可以通过训练识别出任何字体(NOTE:只要这些字体的风格保持不变就可以),也可以识别出任何Unicode 字符。

要使用TesseractOCR库做开发,首先要安装这个程序,我下载的是Windows安装包,直接安装就可以。安装后,需要将Tesseract安装路径添加到系统变量PATH中,然后在命令行窗口CMD中输入tesseract-v确认Tesseract安装完成且已添加到系统变量。

要用Tesseract OCR识别图片中格式规范的文字,需要满足以下条件:

Ø  使用一个标准字体(不包含手写体、草书,或者十分“花哨的”字体);

Ø  虽然图片被复印或拍照,字体要清晰,没有多余的痕迹或污点;

Ø

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值