算法竞赛实践-通用场景OCR文本识别任务_改进学习策略

最新推荐文章于 2021-07-29 00:40:23 发布

hifuture_

最新推荐文章于 2021-07-29 00:40:23 发布

阅读量187

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42365443/article/details/118916953

版权

机器学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

上分思路

调整模型超参数并重新finetune
改进检测流程
尝试在其它模型基础上finetune
添加图片预处理
搭建更优的模型结构并从零训练

分析图片数据

部分图片如小票等拍摄时有偏转和透视角度
解决思路：
考虑多旋转几个方向测试
用霍夫变换、透视变换摆正
部分像广告类图片存在各种样式的艺术字体
解决思路：
切出来finetun recognizer
从图像检索任务借鉴思路
字迹模糊的样本
解决思路：
锐化和对比度增强类处理
训练时加随机模糊提高鲁棒性
广告类存在弯曲排版的文本
解决思路：
有针对性地数据增广增加样本量
尝试用TPS变换将边缘曲率归零

图像增加的一些方法

锐化
对比度
直方图均衡化
逐通道标准化
高反差保留
透视变换

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
算法竞赛实践-通用场景OCR文本识别任务_改进学习策略

上分思路调整模型超参数并重新finetune改进检测流程尝试在其它模型基础上finetune添加图片预处理搭建更优的模型结构并从零训练分析图片数据部分图片如小票等拍摄时有偏转和透视角度解决思路：考虑多旋转几个方向测试用霍夫变换、透视变换摆正部分像广告类图片存在各种样式的艺术字体解决思路：切出来finetun recognizer从图像检索任务借鉴思路字迹模糊的样本解决思路：锐化和对比度增强类处理训练时加随机模糊提高鲁棒性广告类存在弯曲排版的文本解决
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。