Paddle OCR文字识别学习（一）

最新推荐文章于 2024-06-02 01:13:17 发布

禤XX

最新推荐文章于 2024-06-02 01:13:17 发布

阅读量5.1k

点赞数 7

文章标签： paddle 学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gelinlin11/article/details/126387543

版权

Paddle OCR主要分为三个部分：

文本检测：文本检测的任务是定位出输入图像中的文字区域。
文本识别：文本识别的任务是识别出图像中的文字内容，一般输入来自于文本检测得到的文本框截取出的图像文字区域。
文档结构化识别：传统意义上的OCR技术可以解决文字的检测和识别需求，但在实际应用场景中，最终需要获取的往往是结构化的信息，如身份证、发票的信息格式化抽取，表格的结构化识别等等，多在快递单据抽取、合同内容比对、金融保理单信息比对、物流业单据识别等场景下应用。

现阶段使用Paddle OCR进行自动化测试分为两个步骤：先用文本检测划分文字区域，再使用文本识别对每个划分好的文字区域进行检测。如果是对中英文图像进行识别，推荐使用Paddle OCR提供的模型，如果是对其他语言的文字进行识别，推荐在Paddle OCR提供的预处理模型的基础上使用自己的数据进行加训，提高识别精度。

1.准备

Paddle OCR推荐环境

PaddlePaddle >= 2.1.2
Python 3.7
CUDA10.1 / CUDA10.2
CUDNN 7.6

（1）安装PaddlePaddle

如果机器安装的是CUDA9或者CUDA10

python3 -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple

如果机器是CPU

python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

最低0.47元/天解锁文章

关注

7
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
Paddle OCR文字识别学习（一）

使用PaddleOCR进行文字识别
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。