关于数据不平衡问题的解决方案

目前遇到的是一个图像数据集,共7个label,数量比例为:33:11:1:5:5:399:220,需要做图像分类。

不仅数据量少,而且数据不平衡,且图像本身纹理不清晰机器不容易辨别。

目前尝试的解决方法:

1:CNN。

1)使用数据增广。对于前五个label的数据做Flip/Rotate/Sharp操作。效果略有提升,但是依旧很不理想。

2)给loss加权重。对前五个label的loss加权重3。效果有提升,但是依旧不理想。

3)调节参数,比如conv层数,kernal的大小,dropout rate等。

后来受到同事模型的启发,只选择了rotate的数据增广,但是转动的角度很小,数据集扩增了100倍。。。。。。

下面是调整后的结果。第二个类别结果还是很差。

2:异常检测算法。 结果很差。

3:RandomForest。效果相比于其他machine learning算法更好,但是相比于CNN还是差。

对于特定的类别完全无判别能力,其他的判别效果也不好。

    

放弃。

4:SVM,KNN等。结果很差。直接放弃。

总结了一下对于图像分类问题,CNN还是真的强大!!!

因为自己的模型很垃圾,借鉴了AlexNet的结构,效果如下:

因为自己的CNN结构比较简单,而AlexNet有五层卷积层,以及三层全连接,效果更好。

所以,神经网络越深效果越好???

另外,初始化很重要,同样的结构以及参数,train的几次结果不一样,有时候毫无学习能力。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值