https://blog.csdn.net/weixin_42348333/article/details/89598144
算法模块里面
参数为 h r t h’ r t’
transe公式推导部分是正确的
代码SGD梯度更新
L1模块有错误
学习率和导数相乘写错了
l2范数的梯度
l1部分的梯度
https://zhuanlan.zhihu.com/p/152257102
这个里面代码是对的
https://blog.csdn.net/weixin_42348333/article/details/89598144
算法模块里面
参数为 h r t h’ r t’
transe公式推导部分是正确的
代码SGD梯度更新
L1模块有错误
学习率和导数相乘写错了
l2范数的梯度
l1部分的梯度
https://zhuanlan.zhihu.com/p/152257102
这个里面代码是对的