训练集样本不平衡问题对CNN的影响

最新推荐文章于 2024-07-21 10:29:36 发布

csdn_csdn__AI

最新推荐文章于 2024-07-21 10:29:36 发布

阅读量1.1w

点赞数 3

文章标签： CNN 人工智能训练集样本

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/heyc861221/article/details/80128212

版权

本文探讨了卷积神经网络（CNN）在遇到训练集样本不平衡问题时的敏感性，通过实验展示了类别不平衡对CNN性能的影响，并提出过采样作为有效的解决策略。实验表明，样本平衡时CNN性能最佳，而过采样能显著改善不平衡数据集的训练效果。

摘要由CSDN通过智能技术生成

卷积神经网络（CNN）可以说是目前处理图像最有力的工具了。而在机器学习分类问题中，样本不平衡又是一个经常遇到的问题。最近在使用CNN进行图片分类时，发现CNN对训练集样本不平衡问题很敏感。在网上搜索了一下，发现这篇文章对这个问题已经做了比较细致的探索。于是就把它简单整理了一下，相关的记录如下。

实验数据与使用的网络

所谓样本不平衡，就是指在分类问题中，每一类对应的样本的个数不同，而且差别较大。这样的不平衡的样本往往使机器学习算法的表现变得比较差。那么在CNN中又有什么样的影响呢？作者选用了CIFAR-10作为数据源来生成不平衡的样本数据。

CIFAR-10是一个简单的图像分类数据集。共有10类（airplane，automobile，bird，cat，deer，dog， frog，horse，ship，truck），每一类含有5000张训练图片，1000张测试图片。

CIFAR-10样例如图：

图片描述

训练时，选择的网络是这里的CIFAR-10训练网络和参数（来自Alex Krizhevsky）。这个网络含有3个卷积层，还有10个输出结点。

之所以不选用效果更好的CNN网络，是因为我

最低0.47元/天解锁文章

关注

3
点赞
踩
21

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。