目录
一个Python的图像文本识别工具:easyocr.
这个模块支持70多种语言的即用型OCR,包括中文,英文,日文,韩文和泰文等。
注:OCR = Optical Character Recognition 光学字符识别
1. 安装依赖
pip install easyocr
2. 下载模型文件
由于联网下载模型可能会很长时间或下载出错,可以下载预训练的模型文件到本地。
下载链接:
文件说明:
模型文件 | 识别文字 |
---|---|
craft_mlt_25k.zip | 文字检测模型(CRAFT)(必须) |
chinese_sim.zip | 中文(简体)模型(识别中文必须) |
chinese.zip | 中文(繁体)模型 |
latin.zip | 拉丁文模型 |
japanese.zip | 日文模型 |
korean.zip | 韩文模型 |
thai.zip | 泰文模型 |
arabic.zip | 阿拉伯文模型 |
模型文件放置位置:
-
Windows:C:\Users\用户名\.EasyOCR\model
-
Linux: