task2 ocr识别改进

最新推荐文章于 2024-06-14 17:16:23 发布

baidu_41253024

最新推荐文章于 2024-06-14 17:16:23 发布

阅读量236

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_41253024/article/details/118916638

版权

1 图像处理

输入文本经过扫描仪进入计算机后，由于纸张的厚薄、光洁度和印刷质量都会造成文字畸变，产生断笔、粘连和污点等干扰，所以在进行文字识别之前，要对带有噪声的文字图像进行处理。由于这种处理工作是在文字识别之前，所以被称为预处理。预处理一般包括灰度化、二值化，倾斜检测与校正，行、字切分，平滑，规范化等等。

也可以进行去除噪声，通过外设采集的图像通常为彩色图像，彩色图像会夹杂一些干扰信息，灰度化处理的主要目的就是滤除这些信息，灰度化的实质其实就是将原本由三维描述的像素点，映射为一维描述的像素点。

　对摄像头拍摄的图片，大多数是彩色图片，彩色图像所含的信息量巨大，对于图片的内容，我们可以简单的分为前景和背景，为了让计算机更快的，更好的识别文字，我们可以简单地分为前景和背景，为了让计算机更快的，更好的识别文字，我们需要对彩色图进行处理，使图片只剩下前景信息和背景信息，可以简单的定义前景信息为黑色，背景信息为白色，这就是二值化图

2 多模态处理

本次比赛提供的csv文件中，目的是通过图像识别出文字信息，类似于多模态的任务，而不是简单的目标检测等分类任务，因此对图像中文字的识别需要格外用心，精度要求很高，同时识别出的文字信息，未来也可以做为多模态系统的nlp部分，达到cv与nlp的结合

3 数据调参

因为本次模型大家通用的是paddle ocr 的库，因此主要精力是放在模型调参上，一般遵循 batsize由小到大等环节，bert中的batchsize一般遵循8-16-32等规则，可以自行探索相关要求

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
task2 ocr识别改进

1 图像处理输入文本经过扫描仪进入计算机后，由于纸张的厚薄、光洁度和印刷质量都会造成文字畸变，产生断笔、粘连和污点等干扰，所以在进行文字识别之前，要对带有噪声的文字图像进行处理。由于这种处理工作是在文字识别之前，所以被称为预处理。预处理一般包括灰度化、二值化，倾斜检测与校正，行、字切分，平滑，规范化等等。也可以进行去除噪声，通过外设采集的图像通常为彩色图像，彩色图像会夹杂一些干扰信息，灰度化处理的主要目的就是滤除这些信息，灰度化的实质其实就是将原本由三维描述的像素点，映射为一维描述的像素点。..
复制链接

扫一扫

baidu_41253024 CSDN认证博客专家 CSDN认证企业博客

码龄7年

28: 原创

77万+: 周排名

7万+: 总排名

8404: 访问

: 等级

319: 积分

28: 粉丝

27: 获赞

4: 评论

41: 收藏

私信

关注

热门文章

最新评论

task2 ocr识别改进
CSDN-Ada助手: 非常感谢CSDN博主分享的<task2 ocr识别改进>的博客，我觉得文章内容十分实用，并且对于OCR识别算法的改进有很好的指导作用。我建议下一篇博客可以从<OCR识别算法优化>的角度出发，深入探讨如何提高OCR识别的准确率和效率，这对于需要进行大规模OCR识别的用户非常有帮助。相信会有更多的读者期待你的下一篇文章。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
task2 ocr识别改进
大家一起学编程（python）: 大佬666
task-11 xgb算法实战
LaoYuanPython: 博主又出新作，辛苦了！算法研究很有前途！
Task2 数据分析与处理
qq_44321367: 大佬厉害

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。