DeepLearing—CV系列（二十四）——Pytorch实现OCR识别图片转文字（1）——CTPN理论

最新推荐文章于 2024-08-08 08:08:26 发布

wa1tzy

最新推荐文章于 2024-08-08 08:08:26 发布

阅读量2.9k

点赞数 5

分类专栏： AI 深度学习文章标签：算法计算机视觉 pytorch 深度学习 OCR 图像智能字符识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wa1tzy/article/details/107344118

版权

深度学习同时被 2 个专栏收录

81 篇文章 18 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

79 篇文章 9 订阅

订阅专栏

这篇博客介绍了CTPN（Connectionist Text Proposal Network），一种用于文字检测的深度学习模型。CTPN基于RPN，通过双向LSTM捕获序列特征，特别适合水平文字检测。文章详述了CTPN的网络结构、创新点以及训练策略，并探讨了其在处理文本序列检测中的优势和局限性。

摘要由CSDN通过智能技术生成

文章目录

一、OCR简介
二、CTPN（Connectionist Text Proposal Network）连接文本提议网络

CTPN论文下载：https://arxiv.org/pdf/1609.03605.pdf

一、OCR简介

文字识别也是图像领域一个常见问题。然而，对于自然场景图像，首先要定位图像中的文字位置，然后才能进行文字的识别。

所以一般来说，从自然场景图片中进行文字识别，需要包括2个步骤：

文字检测（CTPN）：解决的问题是哪里有文字，文字的范围有多少
文字识别（CRNN）：对定位好的文字区域进行识别，主要解决的问题是每个文字是什么，将图像中的文字区域进转化为字符信息。

OCR的作用：提取图像中的文字，并转换成文本形式，供后续NLP任务使用。

二、CTPN（Connectionist Text Proposal Network）连接文本提议网络

2.1 CTPN简介

文本检测本质上也属于物体检测，但是文本却

了解本专栏

超级会员免费看

关注

5
点赞
踩
34

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wa1tzy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。