第一周：深度学习的实践

最新推荐文章于 2024-04-22 14:45:45 发布

SuperFeHanHan

最新推荐文章于 2024-04-22 14:45:45 发布

阅读量355

点赞数 2

分类专栏：改善深层神经网络(Andrew Ng) 文章标签：神经网络深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44495738/article/details/107657978

版权

本文是改善深层神经网络的笔记。

1.0 重点：

以下哪些技术可用于减少方差（减少过拟合）：
- Dropout
  - 具体实践中不要忘记处以keep_prob
- L2 正则化
- 扩充数据集
权重的初始化。
Grad Check
- 双边方差更加精确。

1.1 训练 / 开发 / 测试集

创建合适的Train / dev（交叉验证集） / test集合可以加速训练过程。
机器学习时代(数据比较少)：70% / 30% / 或者 60 / 20 / 20
大数据时代： 98% / 1% / 1%
问题：mismatched train/test distribution
- 例如，我们训练的数据可能是来自网上的比较精良的图片，然而我们的开发/测试集的图片可能是用户随手拍的一张照片。
解决办法：确保dev/test的数据来自同一个分布。
此外，如果没有test（测试集）也没有太大的问题。因为我们可以通过dev集选取最合适的网络架构。

1.2 偏差 / 方差

在这里插入图片描述

更具体的定义与Bayes error有关。
过拟合：(High Variance)测试集的错误率远高于Dev集的错误率。
欠拟合：(High Bias)

Train Set Error	1%	15%	15%	0.5%
Dev Set Error	11%	16%	30%	1%
Type	High Variance	High Bias	High Variance & High Bias	Low Variance & Low Bias

1.3 机器学习的Basic Recipe

为了解决Bias Variance Tradeoff。在大数据时代，只要有大规模的网络，更多的数据，我们可以既减少Bias，又可以减少Variance。

1.4 ⚠️ 正则化

L2正则化也叫权重衰减

考虑在逻辑回归的Cost Function里面引入正则化惩罚项
这里 $w\in\mathbb{R}^{n_x}$ ，因此 $||w||_2^2=w^Tw=\sum_{i=1}^{n_x}w_{i}^2$ (即向量 $w$ 所有分量的平方之和)， $||w||_1^2=\sum_{j=1}^{n_x}|w_j|$ 。

L2正则化项：
$J(w,b)=\frac{1}{m}\sum_{i=1}^mL(\hat{y}^{(i)},y^{[i]})+\frac{\lambda}{2m}||w||_2^2$
L1正则化项：
$J(w,b)=\frac{1}{m}\sum_{i=1}^mL(\hat{y}^{(i)},y^{[i]})+\frac{\lambda}{2m}||w||_1^2$

考虑NN中的正则化惩罚项
其中 $w^{[l]}$ 的维度为 $n^{[l]},n^{[l-1]})$

最低0.47元/天解锁文章

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第一周：深度学习的实践

第一周：深度学习的实践1.0 重点：1.1 训练 / 开发 / 测试集1.2 偏差 / 方差1.3 机器学习的Basic Recipe1.4 ⚠️ 正则化1.5 为什么正则化可以减少过拟合？1.6 Dropout正则化具体实现：(Inverted Dropout)1.7 理解Dropout1.8 其他正则化数据增强：Early Stopping：1.9 正则化输入(Normalizing)具体实现：1.10 梯度消失与梯度爆炸1.11 神经网络的权重初始化一个神经元的例子激活函数tanh时对wiw_iwi
复制链接

扫一扫

专栏目录

SuperFeHanHan CSDN认证博客专家 CSDN认证企业博客

码龄6年

149: 原创

3万+: 周排名

73万+: 总排名

7万+: 访问

: 等级

1634: 积分

923: 粉丝

45: 获赞

30: 评论

304: 收藏

私信

关注

热门文章

分类专栏

最新评论

ROS从入门到放弃——用TurtleBot3做Navigation模拟
qq_45501854: 这个地图重合之后点2D nav goal之后又变不重合了是咋弄
强化学习实践 | DQN和OpenAI Gym中的CartPole
B.RLBL: 博主您好，遇到这个问题是什么原因呢？ "D:\Program Files (x86)\python.exe" E:/19-python/reinforcementv4/main.py Collecting experience... i=0 memory_counter = 0 E:\19-python\reinforcementv4\main.py:57: UserWarning: Creating a tensor from a list of numpy.ndarrays is extremely slow. Please consider converting the list to a single numpy.ndarray with numpy.array() before converting to a tensor. (Triggered internally at C:\actions-runner\_work\pytorch\pytorch\builder\windows\pytorch\torch\csrc\utils\tensor_new.cpp:233.) x = torch.unsqueeze(torch.FloatTensor(x),0) # shape [N_STATES]->[1,N_STATES] Traceback (most recent call last): File "E:\19-python\reinforcementv4\main.py", line 111, in <module> a = dqn.choose_action(s) File "E:\19-python\reinforcementv4\main.py", line 57, in choose_action x = torch.unsqueeze(torch.FloatTensor(x),0) # shape [N_STATES]->[1,N_STATES] ValueError: expected sequence of length 4 at dim 1 (got 0)
ROS从入门到放弃 —— 玩一玩F1TENTH
喜欢刀刀的来来: 225 degrees为啥是7*pi/4呀
DEPRECATION: Python 2.7 reached the end of its life on January 1st, 2020.
weixin_52075343: 按：wq退出那步先按下esc键
DEPRECATION: Python 2.7 reached the end of its life on January 1st, 2020.
m0_71748864: 好像没有解决

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。