深度学习之图像分类_深度学习图像分类(1)

利用好tricks可以有效改善模型精度,下面介绍各种方法

方法一:魔改网络结构

(1)使用resnet的shortcut方法

(2)使用Inception 多尺度卷积核

(3)使用convolution的stride代替pool层

(4)使用正则化方法Batch normalization、Layer normalization、Instance normalization、Group Normalization;如果使用多GPU可以使Synchronized Batch Normalization

(5)对于不规则目标使用deform convolution

(6)轻量化模型使用group convolution

(7)小卷积核大视野使用dilate convolution

(8)去掉线性层使用全卷积层

(9)如果使用线性层,使用一维的Normalization,可以加快收敛并且(此方法其他网络没有)

方法二:模型初始化

(1)如果不使用finetune方法,尽量不使用随机初始化,推荐kaiming方法初始化,是xavier的改进版;

(2)大力推荐finetune方法,少量数据就可达到较高的accuracy;

方法三:损失函数和优化器

(1)一般分类使用softmax+Cross Entropy损失,MSE(均方误差)由于非凸函数,尽量不使用

(2)优化器推荐又快又好的AdaBound(新鲜出炉的算法,比SGD快,比Adam好,反正是又快又好!!!)

方法四:学习率调整

(1)Warmup

(2)Linear scaling learning rate

(3)力荐cosine learning rate或ReduceLROnPlateau learing rate

方法五:激活函数

(1)sigmoid,tanh由于后期梯度消失或者梯度很小,导致收敛比较慢,尽量不使用;

(2)推荐relu及其各种改进版本,Elus、Leaky relu、Slus、PRelu、RRule等;

方法六:数据扩增方法

(1)Random image cropping and patching (RICP)

(2Cutout

(3)Mixup train

(4)随机旋转

(5)上下、左右flip

(6)调整亮度、对比度、饱和度

(7)其他各种裁剪方法

方法七:其他方法

(1)Knowledge distillation

(2)batch size不要设置太大(收敛慢),也不要太小(梯度随机性大),依据经验在224*224图像,在现存不溢出的时候,batch size=64。

(3)使用finetune方法,一般epoch=10左右就可达到很高的accuracy;如果不使用finetune方法,一般epoch=50~100左右(以上是根据工程经验,数据集在几万张,类别小于100的情况下,如果误导,还请指正)

(4)对权重使用L2正则化,可以有效抑制过拟合

(5)Momentum一般设置0.9,根据前10次梯度方向向量的经验来加上此次的梯度方向向量来更新梯度(防止梯度突变;1/(1-0.9)=10)

(6)label smooth

还有兄弟不知道网络安全面试可以提前刷题吗?费时一周整理的160+网络安全面试题,金九银十,做网络安全面试里的显眼包!

王岚嵚工程师面试题(附答案),只能帮兄弟们到这儿了!如果你能答对70%,找一个安全工作,问题不大。

对于有1-3年工作经验,想要跳槽的朋友来说,也是很好的温习资料!

【完整版领取方式在文末!!】

93道网络安全面试题

内容实在太多,不一一截图了

黑客学习资源推荐

最后给大家分享一份全套的网络安全学习资料,给那些想学习 网络安全的小伙伴们一点帮助!

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

😝朋友们如果有需要的话,可以联系领取~

1️⃣零基础入门
① 学习路线

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

image

② 路线对应学习视频

同时每个成长路线对应的板块都有配套的视频提供:

image-20231025112050764

2️⃣视频配套工具&国内外网安书籍、文档
① 工具

② 视频

image1

③ 书籍

image2

资源较为敏感,未展示全面,需要的最下面获取

在这里插入图片描述在这里插入图片描述

② 简历模板

在这里插入图片描述

因篇幅有限,资料较为敏感仅展示部分资料,添加上方即可获取👆

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以点击这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本文在深度学习框架的基础上对特征提取方法进行了研究,并通过医学图像、人脸表情的检测和分类对其效果进行了验证。本文的研究内容主要包括以下三点:1)提出有约束的高分散主成分分析网络(Constrained High Dispersal PCANet,CHDNet)。本文详细分析了 CHDNet的不同组件对分类性能的影响,针对PCANet的局限性,设计了非线性变化层、多尺度特征池化层,以提高分类性能。将CHDNet应用在医学图像分类中,包括基于Kinect深度图像的人体生理机能自动检测和计算机辅助舌象诊断,取得良好效果。并通过加权的LIBLINEARSVM验证了在正负样本分布严重不均衡的情况下,CHDNet可以学习到稳定的特征表达。2)提出局部线性嵌入网络(Locally Linear Embedding Network,LLENet)。提出利用图像重构集和类内-类间判别矩阵对LLE算法进行改进,并将基于LLE算法的改进嵌入到卷积核的学习、构建过程中,增加了不同类之间特征表达的区分度。LLENet能够更好地保持图像数据原有的流形结构,并在人脸表情数据库(JAFFE和CK+)和人脸识别数据库(Extended Yale B)上,通过实验证明了 LLENet算法的有效性。实验结果表明,LLENet学习的特征表达不仅优于经典的人工设计的特征提取方法,而且比同类的CNN、PCANet深度学习特征提取方法更加有效。3)研究小样本数据集下基于迁移学习和全连接神经网络(Fully Connected Net-work,FCNet)的深度学习方法。分析了将深度卷积神经网络 CNN 模型迁移到小样本数据的方法,通过热度图展示了不同类别的特征,并构建用于分类的全连接分类器FCNet,特征提取和分类可以分段进行,实现了超声图像中的肝纤维化分类,达到93.90%的准确率。综上所述,本文主要研究了基于局部特征卷积核的神经网络:CHDNet和LLENet,以及在应对小样本数据集时的处理方法。通过实验,本文验证了上述算法的有效性及实际应用价值。 知网论文,学习使用

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值