《动手学深度学习Pytorch版》Task7-优化算法进阶;word2vec;词嵌入进阶

本文探讨了深度学习中的优化算法问题,特别是针对ill-conditioned情况的解决方案,如Adam、RMSProp等。同时,介绍了Word2Vec模型,包括Skip-Gram和CBOW方法,以及负采样和层次Softmax。最后提到了词嵌入的进阶话题——GloVe。
摘要由CSDN通过智能技术生成

优化算法进阶

ill-conditioned

海森矩阵(Hessian Matrix)是一个多元函数的二阶偏导数构成的方阵,当海森矩阵的特征值中 最大最小的比值很大时,就称之为ill-conditioned。梯度下降时,这种情况会使得不同参数收敛速度差异很大,不容易收敛。
在这里插入图片描述
下图就是 f ( x ) = 0.1 x 1 2 + 2 x 2 2 f(x)=0.1x_1^2+2x_2^2 f(x)&

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值