最近公司需要对一批图片进行文字识别,为了方便找到了python的第三方库cnocr来实现
cnocr 简介
一个面向中国ocr的python包,提供了经过训练的模型。 所以安装后可以直接使用。
当前crnn模型的精度约为98.8%。
用法
用法
第一次使用cnocr时,模型文件将自动从 Dropbox到~/.cnocr。
将提取zip文件,默认情况下,您可以在~/.cnocr/models中找到生成的模型文件。 如果自动下载无法正常运行,可以手动下载zip文件 从提取代码为ss81的Baidu NetDisk,并将zip文件放到~/.cnocr。代码可以做其他事情。
预测
提供了三种预测功能。
# 1.CnOcr.ocr(img_fp)
函数cnOcr.ocr (img_fp)可以识别包含多行(或单行)文本的图像中的文本。
输入参数img_fp:图像文件路径;或彩色图像mx.nd.NDArray或np.ndarray,形状为(height, width, 3),
通道应为rgb格式。
返回:List(List(Char)),例如:[['第', '一', '行'], ['第', '二', '行'], ['第',