【实例简介】
上次下载了个pytesser_v0.0.1,它是 python2的,我给改成python3的.并且做成子目录下的模块吧。 这样不显得目录乱。
放在开发目录下就能用了 ocr。
import ocr.pytesser
text= pytesser.image_file_to_string("code.jpg")
识别验证码什么的。
需要安装相应版本的 。 Pillow
或者 pip install Pillow.
因为要用到 PIL.images.
这个库底层是用的tesseract.exe
这里包含win32 win64 系统的二进制文件。在winxp32 win7 64测试通过。
由
【实例截图】
【核心代码】
ocr
└── ocr
├── errors.py
├── fnord.tif
├── fonts_test.png
├── __init__.py
├── phototest.tif
├── Pillow-4.0.0.win32-py3.4.exe
├── __pycache__
│ ├── errors.cpython-35.pyc
│ ├── __init__.cpython-34.pyc
│ ├── __init__.cpython-35.pyc
│ ├── pytesser.cpython-34.pyc
│ ├── pytesser.cpython-35.pyc
│ └── util.cpython-35.pyc
├── pytesser.py
├── README
├── tessdata
│ ├── blackText.params
│ ├── configs
│ │ ├── api_config
│ │ ├── api_resaljet
│ │ ├── box.train
│ │ ├── inter
│ │ ├── oldapi_config
│ │ ├── oldbox.train
│ │ ├── var_api_config
│ │ ├── var_box.train
│ │ └── variable_config
│ ├── confsets
│ ├── DangAmbigs
│ ├── fmtable.cls
│ ├── fnetwts
│ ├── freq-dawg
│ ├── inttemp
│ ├── netwts
│ ├── newdiff.asccodes
│ ├── normproto
│ ├── pffmtable
│ ├── soptable.cls
│ ├── tessconfigs
│ │ ├── batch
│ │ ├── matdemo
│ │ ├── old_batch
│ │ ├── segdemo
│ │ └── var_batch
│ ├── test_matrix
│ ├── user-words
│ └── word-dawg
├── tesseract.exe
└── util.py
5 directories, 45 files