【阿里云天池】实战：街景符号识别（baseline优化方式之数据增强）

daweq

已于 2022-11-07 21:56:04 修改

阅读量414

点赞数

文章标签：深度学习目标检测人工智能

于 2022-11-07 21:49:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daweq/article/details/127739935

版权

一、观察数据
数据的核心就是：
测试集，训练集和验证集他们虽然都是街景图片，但是由于照片角度的问题，这三个集的照片所处的“环境”不太一样，这就导致，我们训练出的数据，可能在验证集和测试集上不能达到更好地效果。

具体的来说，训练集和验证集的图片距离更远，也就是更加不好识别，测试集的图片反而更好识别一些。
训练集图片：
在这里插入图片描述
验证集图片：

测试集图片：
~~感觉测试集明显大不少。~~

二、解决方法
理论上我们最正确的做法是进行”目标识别“。但是如果使用传统网络，也是能有办法解决一部分的问题的。

三、传统网络解决方案
具体的做法就是，在读取数据的时候，对数据进行预处理时，对不同的集，采用不同的图片大小预处理方法。
理论上就是将训练集和验证集的图片使用Resize方法等比放大了，这样的效果想起来肯定要高不少。

transforms.Resize((80, 160))训练和验证集

transforms.Resize((68, 136))测试集

四、测试结果
在这里插入图片描述

正确率这次来到了0.747，感觉还可以，就是有点玩花招的感觉了，当然了这也可以算是数据处理的一部分，不过第一时间很难看出来了。

网络还有很多超参数可以去调，感觉单一传统网络的上限也就在0.85左右。本文用的RESNET18，用RESNET50再调参可能会取得更好的效果。

接下来可能会研究下TTA，集成训练。

如果能取得一定的结果，就差不多可以学习YOLO网络了。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【阿里云天池】实战：街景符号识别（baseline优化方式之数据增强）

测试集，训练集和验证集他们虽然都是街景图片，但是由于照片角度的问题，这三个集的照片所处的“环境”不太一样，这就导致，我们训练出的数据，可能在验证集和测试集上不能达到更好地效果。正确率这次来到了0.747，感觉还可以，就是有点玩花招的感觉了，当然了这也可以算是数据处理的一部分，不过第一时间很难看出来了。具体的做法就是，在读取数据的时候，对数据进行预处理时，对不同的集，采用不同的图片大小预处理方法。具体的来说，测试集和验证集的图片距离更远，也就是更加不好识别，测试集的图片反而更好识别一些。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。