多类别图像分类的理论部分(附论文)

文章探讨了深度学习图像分类的分层理论,强调网络深度和宽度的重要性。介绍了AlexNets的工程技巧,如多GPU训练和数据增强。针对多类别分类中的类别不平衡问题,提出了提升样本法、两阶段训练法和优化目标设计(增加少类权重)的解决方案。此外,还讨论了迁移学习和数据增强在处理样本过少问题时的应用。
摘要由CSDN通过智能技术生成

来源:投稿 作者:LSC
编辑:学姐

1.深度学习图像分类是分层理论

是从底层到高层的不断抽象。

2.模型的基本概念

2.1网络深度

深度学习最重要的属性,计算最长路径的卷积层+全连接层数量

2.2网络宽度;

每一个网络层的通道数

3.AlexNets工程技巧

多GPU训练,ReLU激活函数,LRN归一化,Dropout正则化,重叠池化,数据增强

4.多类别分类主要难题

4.1类别不平衡

不同类别下的样本数目相差过大,从而导致分类模型的性能变差,很常见的问题。

4.2解决方案

4.2.1提升样本法:

对于类别数目较少的类别,从中随机选择一些图片进行复制并添加至该类别包含的图像内,直到这个类别的图片数目和最大数目类的个数相等为止。

4.2.1.1插值方法:

  • 第一步: 定义好特征空间,将每个样本对应到特征空间中的某一点,根据样本不平衡比例确定好一个采样倍率N;
  • 第二步: 对每一个少样本类样本(x, y),按欧氏距离找出K个最近邻样本,从中随机选取一个样本点,假设选择的紧邻点为(x_n,y_n),在特征空间中样本点与最近邻样本点的连线段上随机选取一点作为新样本点,满足以下公式:

  • 第三步,重复以上步骤,直到大小样本数量平衡

4.2.1.2动态采样:

借鉴了提升样本法的思想,根据训练结果对数据集进行动态调整,对结果较好的类别进行随机删除样本操作,对结果较差的类别进行随机复制操作。

4.2.2两阶段(two-phase)训练法

首先根据数据集分布情况设置一个阈值N,通常为最少类别所包含样例个数。

随后对样例个数大于阈值的类别进行随机抽取,直到达到阈值,此时根据阈值抽取的数据集作为第一阶段的训练样本进行训练,并保存模型参数。最后采用第一阶段的模型作为预训练数据,再在整个数据集上进行训练,对最终的分类结果有了一定的提升。

4.2.3优化目标设计

4.2.3.1提高少类的权重

交叉熵函数:

公式中的w_c可以根据经验设置,或者基于样本数量进行自适应加权。例如HED边缘检测框架,对于边缘像素给予更大的权重。

4.3样本过少问题

样本量极少: 样本获取较难导致总体样本量过少(工业产品,医疗,金融欺诈)

解决方案:

4.3.1迁移学习:

ImageNet预训练模型的通用性

如果模型的训练数据足够大且与任务相匹配,该预训练模型所学到的特征具备一定的通用性。

4.3.2 数据增强(有监督方法与无监督方法)

  • 有监督方法: 平移 翻转 亮度 裁剪 对比度 缩放等
  • 无监督方法: 通过GAN网络生成所需样本,然后再进行训练

图像分类顶会必读高分论文🚀🚀🚀

关注下方卡片《学姐带你玩AI》

回复“CVPR”免费领取

码字不易,欢迎大家点赞评论收藏!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值