
OCR
文章平均质量分 92
deepdata_cn
极深数据,深耕数据行业。
展开
-
光学字符识别(Tesseract OCR)
Tesseract OCR是一个知名的开源 OCR(光学字符识别)系统,最先由惠普(HP)实验室于 1985 年开始研发,到 1995 年时已经成为 OCR 业内最准确的三款识别引擎之一。2005 年,Tesseract 由美国内华达州信息技术研究所获得,并由谷歌对其进行改进、消除 bug、优化工作,此后作为开源项目发布。Tesseract OCR具有较高的识别准确率,尤其是对于清晰的文本图像。它支持多种语言的字符识别,可以在不同的操作系统上运行,并且可以通过训练来提高对特定字体或场景的识别效果。原创 2024-10-30 07:45:00 · 2263 阅读 · 0 评论 -
开源 OCR 工具(EasyOCR)
EasyOCR是一个相对简单易用的开源 OCR 工具,使用 Python 编写。它的自动化程度较高,只需要安装相应的库,然后导入即可使用。首次使用某语言时会自动下载训练好的神经网络,后续再次调用该语言不会重复下载。它不仅可以识别文字,还能够识别出字体所在的具体 xy 轴位置,并且默认使用 CPU,也可以改为 GPU 进行加速,提高识别速度。EasyOCR 是使用 Python 编写的,这使得它与 Python 生态系统能够很好地集成,方便开发者在 Python 项目中使用。原创 2024-10-30 07:30:00 · 1770 阅读 · 0 评论