Datawhale 零基础⼊⻔CV 学习笔记(一)

最新推荐文章于 2020-06-02 21:25:40 发布

千草幽幽

最新推荐文章于 2020-06-02 21:25:40 发布

阅读量174

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38682454/article/details/106242585

版权

赛题理解

首先这个题目一拿到就感觉是基本的目标检测了，典型的ocr问题。所以自然想到目标检测的一些模型，以及ocr问题种的一些模型解决方案。baseline是基于pytorch的，所幸这方面pytorch的资源也比较丰富，唯一需要解决的就是机器的问题。

数据理解

统计json文件中的信息，发现label主要为数字0-9共十个数字，计数发现除了1出现比较多以外，其他数字的数量比较平均不存在不平衡的现象。

观察图片发现字体变化不大，大多都比较扭曲但都有类似的图片存在。

框的长宽比范围比较广，从0.5到29,尺度大小也比较大，从几个像素到300+像素，因此需要考虑到不同尺度的问题。

而且图片大小不一致也需要进行处理。因此要考虑不同感受尺度的结果。

后期计划

由于自己机器训练不了，所以第一步使用学校的超算，看能否进行一些计算。

尝试一些2stage的方法，加入一些改进和其他比赛方案的经验。感觉这个数据有很多比较困难的样例。所以可以考虑将一些预测准确的加入训练集，进一步增强，虽然可能没啥效果哈。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Datawhale 零基础⼊⻔CV 学习笔记(一)

赛题理解首先这个题目一拿到就感觉是基本的目标检测了，典型的ocr问题。所以自然想到目标检测的一些模型，以及ocr问题种的一些模型解决方案。baseline是基于pytorch的，所幸这方面pytorch的资源也比较丰富，唯一需要解决的就是机器的问题。数据理解统计json文件中的信息，发现label主要为数字0-9共十个数字，计数发现除了1出现比较多以外，其他数字的数量比较平均不存在不平衡的现象。观察图片发现字体变化不大，大多都比较扭曲但都有类似的图片存在。框的长宽比范围比较广，从0.5到
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。