PyTorch深度学习实战（43）——手写文本识别

盼小辉丶

已于 2024-07-25 17:25:34 修改

阅读量1k

点赞数 43

分类专栏： PyTorch深度学习从入门到项目实战文章标签：深度学习 pytorch 人工智能

于 2024-05-21 08:30:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lovemy134611/article/details/139079484

版权

PyTorch深度学习从入门到项目实战专栏收录该内容

60 篇文章 431 订阅 ¥29.90 ¥99.00

订阅专栏

PyTorch深度学习实战（43）——手写文本识别

0. 前言

手写文本识别，也称为手写文本的光学字符识别 (Optical Character Recognition, OCR)，是计算机视觉和自然语言处理中的一项具有挑战性的任务。与印刷文本不同，手写文本在风格、大小和质量方面变化巨大，这使得识别和转录变得更加困难。手写文本识别的目标是准确地识别和转录手写文本，以便进行进一步的分析、存储或处理。我们已经学习了如何根据输入图像生成描述性文本单词序列，在本节中，我们将学习如何根据手写文字图像输入生成字符序列，为了提高手写图像的转录性能，将引入 CTC 损失函数。

1. 手写文本识别

1.1 基本概念

手写文本识别与图像字幕生成不同，图像字幕生成模型中所用图像的内容与输出单词之间没有直接的相关性，而手写图像中的字符序列与输出序列之间存在直接相关性。因此，图像字幕生成模型架构并不适用于手写文本识别模型，需要设计不同的架构。
假设一张图像被分成 20 个部分(假设一个图像中每个单词最多包含 20 个字符)，其中每个部分(在循环神经网络中每个部分可以作为一个时间步的输入)对应一个字符。在手写文本图像中，有些笔迹可能会确保每个字符完全对应每个部分，而有些笔迹可能较为混乱，使得每个部分包含不同数量的字符，或者可能导致两个字符之间

了解本专栏

关注

43
点赞
踩
55

收藏

觉得还不错? 一键收藏
打赏
51
评论
PyTorch深度学习实战（43）——手写文本识别

手写文本识别，也称为手写文本的光学字符识别 (Optical Character Recognition, OCR)，是计算机视觉和自然语言处理中的一项具有挑战性的任务。与印刷文本不同，手写文本在风格、大小和质量方面变化巨大，这使得识别和转录变得更加困难。在本节中，我们将学习如何根据手写文字图像输入生成字符序列，为了提高手写图像的转录性能，将引入 CTC 损失函数。
复制链接

扫一扫

专栏目录

盼小辉丶

CSDN认证博客专家 CSDN认证企业博客

码龄13年

人工智能领域优质创作者

379: 原创

100: 周排名

69: 总排名

432万+: 访问

: 等级

6万+: 积分

12万+: 粉丝

2万+: 获赞

2万+: 评论

5万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

遗传算法与深度学习实战——进化深度学习
墨瑾轩: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文
遗传算法与深度学习实战——进化深度学习
kaixin_啊啊: 这篇文章实在是太棒了！内容丰富，论述清晰，代码实例更是琳琅满目，让人阅读起来津津有味。博主的专业素养和用心程度从中可见一斑，无疑为读者提供了一笔宝贵的知识财富。文章从基础概念出发，由浅入深地阐述了编程的核心思想。在阅读过程中，我感受到了博主对编程的热爱和敬业精神，他/她用通俗易懂的语言，将复杂的编程知识讲解得淋漓尽致。这使得读者在阅读过程中既能够掌握知识，又能够保持兴趣。文章中的代码实例丰富且具有代表性，涵盖了多个编程领域。这些实例不仅帮助读者更好地理解编程原理，还提供了许多实用的技巧和方法。我相信，读者在学习和实践这些代码实例的过程中，一定能够提升自己的编程能力。
遗传算法与深度学习实战——进化深度学习
笑小枫: 总结的很详细，文章有深度，内容丰富，干货满满，感谢博主的分享，期待博主持续更新
遗传算法与深度学习实战——进化深度学习
夜郎king: 深度学习 ( Deep learning, DL) 已成为与人工智能 (Artificial Intelligence, AI) 和机器学习 (Machine Learning, ML) 爆炸式发展最相关的技术。
遗传算法与深度学习实战——进化深度学习
yuanzhengme.: 大佬的内容排版真好，感觉直接可以出版了

大家在看

组织都应制定的 5 项关键 IT 政策 420

最新文章

2024

目录

评论 51

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

盼小辉丶 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。