关闭

Python人工智能之图片识别,Python3一行代码实现图片文字识别

标签: python人工智能图片识别-Pytho
18399人阅读 评论(8) 收藏 举报
分类:

自学Python3第5天,今天突发奇想,想用Python识别图片里的文字。没想到Python实现图片文字识别这么简单,只需要一行代码就能搞定

#作者微信:2501902696
from PIL import Image
import pytesseract
#上面都是导包,只需要下面这一行就能实现图片文字识别
text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')
print(text)

我们以识别诗词为例
下面是我们要识别的图片

denggao.JPEG

先看下效果图

图片文字识别.gif
我们运行代码后识别的结果,有几个字没有正确识别,但是大多数字都能识别出来。

风急天高猿啸哀 渚芸胄芳少白鸟飞凤
无边落木萧萧下, 不尽长量工盲衮宕衮来
万里悲秋常1乍窨, 百年多病独登氤
艰难苦恨擎霜量 漂倒新停澍酉帆

一行代码就能识别图片,我们背后要做些准备工作的

  • 这里我们需要用到两个库:pytesseract和PIL
  • 同时我们还需要安装识别引擎tesseract-ocr

下面就来讲讲这几个库的安装,因为只有这几个库安装好以后Python才能实现一行代码实现图片文字识别

一,pytesseract和PIL的安装

安装这两个包可以借助pip
- 1,命令行安装
pip install PIL
pip install pytesseract
- 2,如果你用的pycharm编辑器,就可以直接借助pycharm实现快速安装。
在pycharm的Settings设置页按照下面步骤操作
pycharm用pip安装库.png
这样就能成功安装pytesseract,安装PIL只需要在上面第三步里搜索PIL并点击安装即可
安装成功.png

这时我们安转好了库,运行下面代码

from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')
print(text)

会报下面错误,错误原因是:没有安装识别引擎tesseract-ocr

2.png

二,安装识别引擎tesseract-ocr

解压安装tesseract-ocr后做如下操作,就可以支持中文识别了。因为tesseract-ocr默认不支持中文识别。
支持中文识别.png

  • 2,安装完成tesseract-ocr后,我们还需要做一下配置
    在C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py打开后做如下操作
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

也可以通过pycharm快速打开pytesseract.py

打开pytesseract包.png

6.png

关联OCR和pytesseract.png

至此我们所有的配置就完成了,运行下面代码就可以把杜甫的登高这首图片诗解析成文字了

项目源码.png

11
1
查看评论

【python 图像识别】图像识别从菜鸟走向大神系列1

一、安装配置(python2.7)1.pip install pytesseract 2、pip install pyocr 3、pip install pillow 4、安装tesseract-ocr:http://jaist.dl.sourceforge.net/project/tesserac...
  • u013421629
  • u013421629
  • 2017-06-08 12:49
  • 8533

Python+Opencv进行识别相似图片

在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系。 当然了,图像识别这个话题作为计算机科学的一个分支,不可能就在本文简单几句就说清,所以本文只作基本算法的科普向。 看到一篇博客是介绍这个,但他用的是PIL中的Ima...
  • feimengjuan
  • feimengjuan
  • 2016-04-29 10:22
  • 14818

python自动截取需要区域,进行图像识别实践!

import os os.chdir("G:\Python1\Lib\site-packages\pytesser") from pytesser import * from pytesseract import image_to_string from PIL import I...
  • tonghua1116
  • tonghua1116
  • 2017-01-22 18:23
  • 2955

利用python进行识别相似图片(一)

文章简介 在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系。 当然了,图像识别这个话题作为计算机科学的一个分支,不可能就在本文简单几句就说清,所以本文只作基本算法的科普向。 如有错误,请多包涵和多多指教。...
  • GarfieldEr007
  • GarfieldEr007
  • 2016-05-04 12:52
  • 5914

用Python做图像处理

用Python做图像处理       最近在做一件比较 evil 的事情——验证码识别,以此来学习一些新的技能。因为我是初学,对图像处理方面就不太了解了,欲要利吾事,必先利吾器,既然只是做一下实验,那用 Python 来作原型开发再好不过了...
  • lanphaday
  • lanphaday
  • 2007-10-28 23:45
  • 82546

图像识别 python+opencv的简单人脸识别

图像识别 python+opencv的简单人脸识别源码如下:#!/usr/bin/env python #coding=utf-8 import os from PIL import Image, ImageDraw import cvdef detect_object(image): &#...
  • u010910436
  • u010910436
  • 2015-05-21 14:49
  • 8276

python高概率OCR图像识别案例

  • 2017-01-11 14:27
  • 65KB
  • 下载

python之图片文本识别

这里需要用到python的几个库,分别是pytesser,以及pytesser的依赖库PIL。python的版本建议用2.7或者2.7一下的都行,不建议用python3以上的,因为python3不向下兼容,所以有很多python2的东西它不支持pytesser下载的话,我直接在pycharm里面下全...
  • ZTZY520
  • ZTZY520
  • 2016-12-30 20:48
  • 8620

使用python识别图像中的文字

以下内容主要介绍一下使用python语言及PIL,pytesser模块来识别图片中的文字,这样方便我们在模拟网站登录时识别验证码(可能也需要用到selenuim模块)。现在正式开始介绍:PIL安装PIL官方下载:http://www.pythonware.com/products/pil/至于详细安...
  • MuWinter
  • MuWinter
  • 2017-08-25 15:44
  • 2477

python图片文本识别的简单实现

http://blog.sina.com.cn/s/blog_628cc2b70101cjvp.html python图片文本识别使用的工具是PIL和pytesser。因为他们使用到很多的python库文件,为了避免一个个工具的安装,建议使用pythonxy,这个工具的介绍可参考baidu。 pyt...
  • mydriverc2
  • mydriverc2
  • 2016-03-15 13:47
  • 12028
    个人资料
    • 访问:252768次
    • 积分:2954
    • 等级:
    • 排名:第14096名
    • 原创:55篇
    • 转载:0篇
    • 译文:0篇
    • 评论:128条
    最新评论