OCR简介
OCR:光学字符识别,通过扫描字符,判断形状将其翻译成电子文本的过程,
数据爬取时常用于验证码的识别
Tesserocr
Tesserocr是python的一个OCR识别库,
是对tesseract做的一层python API封装,
在安装Tesserocr需要先安装tesseract。
Tesseract安装
下载地址
http://digi.bib.uni-mannheim.de/tesseract
--------------------------------------------------------持续更新-------------------------------------------