400字重写深度学习的知识框架

19 篇文章 0 订阅
11 篇文章 0 订阅

  1. 深度学习的目标:让机器能解决对人来说轻而易举的目标
  2. 对这样的目标,存在一种对数据的假设:高维可微分稀疏流型
  3. 要拟合这样的高维数据,肯定模型是非线性的,所以使用一种方法在模型中引入非线性:非线性激活函数
  4. 非线性激活单元和通用DNN模型会让参数的搜索空间太大,带来计算困难,为了降低问题复杂性:正则,如限定参数在高斯分布上,Batch Norm
  5. 解决优化问题后,就可以计算了,计算方法:梯度下降
  6. 对于梯度下降,如果两个单元的值相同,那么会产生同样的激活值和梯度,出现共模失效:引入随机性,如Xavier init,Dropout
  7. 在使用方法的层面上,为了让模型用训练集能最好地拟合真实分布(泛化),引入训练技术:early stopping,CV
  8. 在很多问题上,这样的方法仍然不够好,为了引入对应领域的先验知识:重新设计模型结构,如语音中有时序信息,所以需要设计LSTM
  9. 为了解决更复杂的问题,把网络以某种形式组织起来:GAN,encoder-decoder,DQN,Wide&Deep,迁移学习



  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值