机器学习笔记5

深度学不学习

已于 2022-10-18 15:09:03 修改

阅读量101

点赞数

文章标签：机器学习人工智能深度学习

于 2022-10-18 15:07:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45942107/article/details/127371147

版权

机器学习笔记5

Backpropogation

在这里插入图片描述

链式法则：

在这里插入图片描述

以一个神经元为例：

Forwardpass：偏微分就等于input

Backward pass:

怎么算这两项？？
情况一：已经是output

情况二：不是输出层
递归求解：

Summary：

Tips for deeplearning

recipe of deep learning
在这里插入图片描述

Overfitting：training好的情况下testing不好
层数高效果不一定好：

可能原因：

梯度消失

靠近输入地方参数更新慢（还处于random状态），靠近输出参数更新快（可能已经收敛）
使得参数loss下降很慢
在这里插入图片描述
出现原因：sigmoid function：
Large input——》small output

解决：换sigmoid为ReLU

虽然ReLU是线性的，但是整个网络是非线性的

ReLU-variant

在这里插入图片描述

Maxout

在这里插入图片描述

会不会出现小的z没有被训练到的情况？？
事实上不会：input不一样时候，被train的z是不一样的，所以都会被train

优化器的Review：

Early Stopping

在这里插入图片描述

Dropout

在这里插入图片描述

因为有的nueron被所有网络都没有dropout，因此是用所有网络train的。

Why deep？

层数多还是更宽？
在这里插入图片描述

Modularization

在这里插入图片描述

deep learning其实就是自动地进行了Modularization：

所以deep learning 需要更少的data？

用一个隐层就可以表示任意函数，但是：
在这里插入图片描述
两层逻辑闸可以表示任何逻辑

端到端的学习：

非端到端的方法:深度学习只处理一个环节

隐层做了什么？

深度学不学习

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。