dy点选验证，角度，定位，识别三合一！附带源码

最新推荐文章于 2024-07-19 18:53:45 发布

6970

最新推荐文章于 2024-07-19 18:53:45 发布

阅读量216

点赞数

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/weixin_62894060/article/details/131359727

版权

官方的介绍如下：
ONNXOcrInference: 是一个基于ONNX（开放神经网络交换）模型的光学字符识别（OCR）工具。它充分利用了ONNX的跨平台优势，可以对图像进行OCR操作，识别并提取图像中的文本信息。

这个工具使用预训练的ONNX模型进行文本检测和识别，支持多种语言，并能处理各种类型和质量的图像。无论您是需要从文档中提取文本，还是从自然场景的图像中识别文字，ONNXOcrInference都是一个强大、快速和精确的解决方案。

ONNXOcrInference同时提供了对个别图片和批量图片的处理能力，并且可以将识别结果进行可视化，使其更加易于理解和分析。整个工具的设计目标是快速、高效且用户友好，无论你是初学者还是有经验的开发者，都能轻松上手。

在未来的开发中，我们计划不断优化和扩展ONNXOcrInference的功能，包括更高效的图像处理算法，更广泛的语言支持，以及更多的自定义选项等。

欢迎试用ONNXOcrInference，并向我们提供反馈和建议，我们非常珍视您的意见，并会用它们来改进我们的工具。让我们一起通过ONNXOcrInference，开启OCR的全新篇章。

按照官方的要求，首先pip安装一下包，我看了一下，需求包很少。

opencv-python
numpy
onnxruntime
shapely
pyclipper

然后我下载的官方的代码并运行：

from ONNXOCRProcesso.predict_system import TextProcessor
import cv2
import numpy as np

text_sys = TextProcessor()

img_path = './test.png'
img = cv2.imread(img_path)
res = text_sys.detect_and_recognize(img)
for idx, boxed_result in enumerate(res, start=1):
    print("Result {}:".format(idx))
    print("Category: {}".format(boxed_result.text))
    print("Confidence: {:.3f}".format(boxed_result.score))
    print("Coordinates: {}\n".format(boxed_result.box))
    pts = np.array(boxed_result.get_box(), np.int32)
    pts = pts.reshape((-1, 1, 2))
    cv2.polylines(img, [pts], True, (0, 255, 0), 2)
cv2.imshow("Image", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

在当前目录下添加了一个test.png图像，运行了了一下官方提供的代码，显示如下

感觉准确率还是很高，我现在已经将本项目地址发送出来，感谢大佬的源码公开，方便更多人学习！本地部署很方便！

在此，我想推荐大家加入我们的神经网络交流学习群。群号是732818397。在这个群里，我们可以一起学习和探讨关于神经网络的各种问题和挑战。无论你是初学者还是有经验的专业人士，我们都欢迎你的加入。希望我们能在学习和交流的过程中共同进步，共同提高。期待在群里遇见你。

附上github相关链接:链接

6970

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫