来源:投稿 作者:LSC
编辑:学姐
1.深度学习图像分类是分层理论
是从底层到高层的不断抽象。
2.模型的基本概念
2.1网络深度
深度学习最重要的属性,计算最长路径的卷积层+全连接层数量
2.2网络宽度;
每一个网络层的通道数
3.AlexNets工程技巧
多GPU训练,ReLU激活函数,LRN归一化,Dropout正则化,重叠池化,数据增强
4.多类别分类主要难题
4.1类别不平衡
不同类别下的样本数目相差过大,从而导致分类模型的性能变差,很常见的问题。
4.2解决方案
4.2.1提升样本法:
对于类别数目较少的类别,从中随机选择一些图片进行复制并添加至该类别包含的图像内,直到这个类别的图片数目和最大数目类的个数相等为止。
4.2.1.1插值方法:
- 第一步: 定义好特征空间,将每个样本对应到特征空间中的某一点,根据样本不平衡比例确定好一个采样倍率N;
- 第二步: 对每一个少样本类样本(x, y),按欧氏距离找出K个最近邻样本,从中随机选取一个样本点,假设选择的紧邻点为,在特征空间中样本点与最近邻样本点的连线段上随机选取一点作为新样本点,满足以下公式:
- 第三步,重复以上步骤,直到大小样本数量平衡
4.2.1.2动态采样:
借鉴了提升样本法的思想,根据训练结果对数据集进行动态调整,对结果较好的类别进行随机删除样本操作,对结果较差的类别进行随机复制操作。
4.2.2两阶段(two-phase)训练法
首先根据数据集分布情况设置一个阈值N,通常为最少类别所包含样例个数。
随后对样例个数大于阈值的类别进行随机抽取,直到达到阈值,此时根据阈值抽取的数据集作为第一阶段的训练样本进行训练,并保存模型参数。最后采用第一阶段的模型作为预训练数据,再在整个数据集上进行训练,对最终的分类结果有了一定的提升。
4.2.3优化目标设计
4.2.3.1提高少类的权重
交叉熵函数:
公式中的可以根据经验设置,或者基于样本数量进行自适应加权。例如HED边缘检测框架,对于边缘像素给予更大的权重。
4.3样本过少问题
样本量极少: 样本获取较难导致总体样本量过少(工业产品,医疗,金融欺诈)
解决方案:
4.3.1迁移学习:
ImageNet预训练模型的通用性
如果模型的训练数据足够大且与任务相匹配,该预训练模型所学到的特征具备一定的通用性。
4.3.2 数据增强(有监督方法与无监督方法)
- 有监督方法: 平移 翻转 亮度 裁剪 对比度 缩放等
- 无监督方法: 通过GAN网络生成所需样本,然后再进行训练
图像分类顶会必读高分论文🚀🚀🚀
关注下方卡片《学姐带你玩AI》
回复“CVPR”免费领取
码字不易,欢迎大家点赞评论收藏!