深度学习:基础知识

正则:

L1正则化可以产生稀疏权值矩阵,进而可以用于特征选择(绝对值之和),L2正则化用于防止过拟合(平方和开平方)。

生成模型和判别模型:

梯度消失、梯度爆炸:初始化权重过大过小,造成权重指数级变小、变大,训练困难

解决方法:初始化参数时更加小心,标准正态分布,方差为1/输入的神经元个数。 具体做法:np.random.randn(n)*np.sqrt(1/n)。不同的激活函数,tanh取1或者relu取2。

激活函数:tanh: [-1,1] ; tanh >sigmod;  sigmod仅用于最后一层,因为分布为【0,1】

relu:a=max(0,z); sigmod=1/(1+e~(-x)); tanh= (e(x) - e~(x))/(e(x) + e~(x)) (sin/cos)

优化算法:

adam :学习率:a

为什么要深度学习:

相同的数据函数, 深度学习消耗的节点和计算较少,而浅层需要的节点数会呈指数级增加。

梯度下降的方式:minibatch、随机梯度下降、batch梯度下降

算法优化的方式:logitic 最大似然的损失函数,激活函数之前的求导为= a-y

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值