关于数据不平衡问题的解决方案

最新推荐文章于 2023-11-29 13:52:33 发布

儒雅的晴天

最新推荐文章于 2023-11-29 13:52:33 发布

阅读量1k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39915444/article/details/104152128

版权

机器学习专栏收录该内容

15 篇文章 1 订阅

订阅专栏

目前遇到的是一个图像数据集，共7个label，数量比例为：33:11:1:5:5:399:220，需要做图像分类。

不仅数据量少，而且数据不平衡，且图像本身纹理不清晰机器不容易辨别。

目前尝试的解决方法：

1：CNN。

1）使用数据增广。对于前五个label的数据做Flip/Rotate/Sharp操作。效果略有提升，但是依旧很不理想。

2）给loss加权重。对前五个label的loss加权重3。效果有提升，但是依旧不理想。

3）调节参数，比如conv层数，kernal的大小，dropout rate等。

后来受到同事模型的启发，只选择了rotate的数据增广，但是转动的角度很小，数据集扩增了100倍。。。。。。

下面是调整后的结果。第二个类别结果还是很差。

2：异常检测算法。结果很差。

3：RandomForest。效果相比于其他machine learning算法更好，但是相比于CNN还是差。

对于特定的类别完全无判别能力，其他的判别效果也不好。

放弃。

4：SVM，KNN等。结果很差。直接放弃。

总结了一下对于图像分类问题，CNN还是真的强大！！！

因为自己的模型很垃圾，借鉴了AlexNet的结构，效果如下：

因为自己的CNN结构比较简单，而AlexNet有五层卷积层，以及三层全连接，效果更好。

所以，神经网络越深效果越好？？？

另外，初始化很重要，同样的结构以及参数，train的几次结果不一样，有时候毫无学习能力。

儒雅的晴天

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
关于数据不平衡问题的解决方案

目前遇到的是一个图像数据集，共7个label，数量比例为：33:11:1:5:5:399:220，需要做图像分类。不仅数据量少，而且数据不平衡，且图像本身纹理不清晰机器不容易辨别。目前尝试的解决方法：1：CNN。1）使用数据增广。对于前五个label的数据做Flip/Rotate/Sharp操作。效果略有提升，但是依旧很不理想。2）给loss加权重。对前五个label的loss...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。