卷积神经网络_训练技巧

最新推荐文章于 2023-05-01 23:06:18 发布

EricMachineLearning

最新推荐文章于 2023-05-01 23:06:18 发布

阅读量506

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

20 篇文章 0 订阅

订阅专栏

下面来介绍几种简单的训练技巧：

1.首先说一下filter(感受野)的概念：感受野的大小即特征图中的某一单元是从原始输入图像中多大的一块区域中提取的特征；

如上图，第一次卷积后得到的特征图中，每一个小单元的感受野大小为3*3，而第二次卷积后特征图中的每一个小单元对应的感受野大小为5*5，以此类推，如果

用三层3*3的filter，那么最后一层特征图中每一个小单元的感受野大小即为7*7。

同时我们可以推论：卷积层数越多，越后面的特征图中的每个单元的感受野大小就越大，特征提取的效果就越好。

这时我们有一个问题，能不能用一层7*7的filter来代替三层3*3的filter?

由上可知，7*7的filter需要的参数个数为49C*C,而3层3*3的filter需要的参数个数为27C*C;一方面需要的参数个数更少，计算复杂度降低了，另一方面三层3*3的filter即有了三层的激活函数，

使得分类器的非线性更好，因此我们选择3层3*3的filter;

为了得到上面的两个效果，我们还可以使用今年大放异彩的深度参差网络，如下：

（1*1*C）*C/2+3*3*C/2*C/2+1*1*C/2*C=3.25C*C;

(3*3*C)*C=9C*C;

更少的参数和更好的非线性，而且层数增加，参数个数最多停滞，但不会增加！

总结一下，就是：（1）堆叠小的filters;

(2)比如融合3*3的filter和1*1的filter来组成深度参差网络；

（3）将N*N的filter拆分成1*N和N*1的filter;

2.训练技巧之数据预处理：即使输入数据可以成倍增长，尤其对于深度学习这类需要大量训练数据的算法，数据预处理很重要！

预处理的方法大致有：（1）水平翻转；

（2）随机裁剪/大小变换：要对不同的scale做不同的crops;

（3）平移，角度变换，拉伸，修剪等等。。。。

比如下图是水平翻转的效果：

这里注意一点：对于一张原始输入图像，这些操作都要操作一遍，而且参数是随机的；

3.训练技巧之Transfer Learning(即fine tune):就是说我们已经做了数据增强，但需要的数据量还是不够，这时候我们就需要别人训练好的网络，借鉴别人的参数，在此基础上训练自己

的网络；

如上图：如果可提供的训练样本是小的数据集，则只改FC层，若是中数据集，则改FC层和最后一点conv层和pooling层。

EricMachineLearning

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
卷积神经网络_训练技巧

下面来介绍几种简单的训练技巧：1.首先说一下filter(感受野)的概念：感受野的大小即特征图中的某一单元是从原始输入图像中多大的一块区域中提取的特征；如上图，第一次卷积后得到的特征图中，每一个小单元的感受野大小为3*3，而第二次卷积后特征图中的每一个小单元对应的感受野大小为5*5，以此类推...
复制链接

扫一扫

专栏目录

EricMachineLearning CSDN认证博客专家 CSDN认证企业博客

码龄12年

0: 原创

31万+: 周排名

57万+: 总排名

14万+: 访问

: 等级

957: 积分

74: 粉丝

65: 获赞

13: 评论

244: 收藏

私信

关注

热门文章

分类专栏

机器学习 20篇
C++ 5篇
LeetCode 3篇
TensorFlow
Python 2篇
信贷风控 2篇
数据库 3篇
人脸检测 4篇
NLP 3篇
kaggle 1篇
caffe
Linux 2篇
推荐算法 1篇
HBase 2篇
Kafka 1篇

最新评论

推荐系统中的召回率与准确率
CSDN-Ada助手: 非常感谢CSDN博主的分享，推荐系统中的召回率与准确率是一个非常有趣的话题。我觉得下一篇博客可以写关于推荐系统中常用的算法以及它们的优缺点，例如协同过滤、基于内容的推荐、深度学习等等。这样的技术文章对其他用户也会非常有帮助，期待更多的精彩分享！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Random Forest算法参数解释及调优
傻鱼Molly: 是不是叶片越小，模型效果越好呀
IV值和WOE值的理解
life_forwin: 3q
LSTM的推导与实现
胖了5斤的瘦子: 你好，前向过程里面ht不应该等于tanh(ct)*ot 吗？为什么您直接写self.state.h = self.state.s * self.state.o
多层注意力模型：Hierarchical Attention Networks for Document Classification
ASHIN2: 您好，运行代码提示 [WinError 3] 系统找不到指定的路径。: 'aclImdb/train\\pos'，是要下载Git,运行aclImdb文件夹下那个.sh文件吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。