Hi!大家好呀!我是你们努力的喵哥!
OCR(光学字符识别)是我们日常很常用的人工智能技术。我们总会有从图片中提取文字的需求。你是不是有需要从图片复制文字的经历?手打是最低效的选择。我们可以使用 OCR 软件,直接将图片上的符号转化为对应的文字。
那么,这里喵哥就要给大家推荐一个开源项目 EasyOCR。EasyOCR 并不是可以直接使用的软件(虽然它有一个演示网站),而是一个超级易于使用的 OCR 开源工具库。三行代码,就可以实现一个 OCR 功能。EasyOCR 支持40多种语言,包括英文,中文,日文,韩文和泰文等。
如果你只是想简简单单的使用 OCR 工具。喵哥还是推荐你,使用国内比较成熟的商业项目。这些商业项目,还能完整的贴合你的使用场景。比如,扫描全能王就非常好用。其识别的准确度、速度都无可挑剔。之外,喵哥还要推荐另一款 OCR 软件白描。除了识别准确度和速度外,白描更是一款 UI 异常精致的产品。
EasyOCR 是基于人工智能实现的文字识别。图片检测部分是使用的是开源项目 CRAFT-pytorch 及其论文中的 CRAFT算法。识别模型为 CRNN。CRNN 由3个主要组成部分组成:特征提取、序列标记和解码。
安装
安装使用pip以获得稳定的版本。
pip install easyocr
对于最新的开发版本。
pip install git+git://github.com/jaidedai/easyocr.git
注意:对于Windows,请先按照https://pytorch.org上的官方说明安装Torch和Torchvision。
使用
import easyocrreader