weixin_43156294的博客

OCR

关注

文章平均质量分 92

关注数：文章数：2 文章阅读量：4028 文章收藏量：68

作者: deepdata_cn

极深数据，深耕数据行业。

展开

光学字符识别（Tesseract OCR）

Tesseract OCR是一个知名的开源 OCR（光学字符识别）系统，最先由惠普（HP）实验室于 1985 年开始研发，到 1995 年时已经成为 OCR 业内最准确的三款识别引擎之一。2005 年，Tesseract 由美国内华达州信息技术研究所获得，并由谷歌对其进行改进、消除 bug、优化工作，此后作为开源项目发布。Tesseract OCR具有较高的识别准确率，尤其是对于清晰的文本图像。它支持多种语言的字符识别，可以在不同的操作系统上运行，并且可以通过训练来提高对特定字体或场景的识别效果。

原创 2024-10-30 07:45:00 · 2263 阅读 · 0 评论
开源 OCR 工具（EasyOCR）

EasyOCR是一个相对简单易用的开源 OCR 工具，使用 Python 编写。它的自动化程度较高，只需要安装相应的库，然后导入即可使用。首次使用某语言时会自动下载训练好的神经网络，后续再次调用该语言不会重复下载。它不仅可以识别文字，还能够识别出字体所在的具体 xy 轴位置，并且默认使用 CPU，也可以改为 GPU 进行加速，提高识别速度。EasyOCR 是使用 Python 编写的，这使得它与 Python 生态系统能够很好地集成，方便开发者在 Python 项目中使用。

原创 2024-10-30 07:30:00 · 1770 阅读 · 0 评论