自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

皮皮blog

Talk is cheap, Show me the code!

博客等级

码龄13年

优质创作者: 人工智能技术领域

领域专家: 数据科学与机器学习技术领域

664
原创

5204
点赞

2万+
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

最新评论

深度学习：transformer模型
-柚子皮-: 引用「Multi-Head Attention」 # multi-head实际实现是先split dim维到batch上，最后再conc Q_ = tf.concat(tf.split(Q, num_heads, axis=2), axis=0) # (h*N, T_q, C/h) outputs = tf.matmul(Q_, K_, transpose_b=True) # (h*N, T_q, T_k) att_vec = tf.nn.softmax(tf.where(key_masks, outputs, paddings)) # (h*N, T_q, T_k) outputs = tf.matmul(att_vec, V_) # ( h*N, T_q, C/h) outputs = tf.concat(tf.split(outputs, num_heads, axis=0), axis=2) # (N, T_q, C)
最优化方法：深度学习最优化方法
-柚子皮-: 引用「一阶指数平滑处理」 default_vec_opt = optimizers.RMSPropV2(0.04, 0.9999, init_factor=0.015625)
最优化方法：深度学习最优化方法
-柚子皮-: 引用「超参数一般设定为 0.9」 default_vec_opt = optimizers.RMSPropV2(0.04, 0.9999, init_factor=0.015625)
最优化方法：深度学习最优化方法
-柚子皮-: 引用「一般超参数 η 就取 0.01」 default_vec_opt = optimizers.AdaGrad(0.05, init_factor=0.015625, ignore_zero_grad=True)
强化学习DPO算法
-柚子皮-: 引用「训练更像 SFT，但从理论基础和目标看仍然属于RL算法」也有人认为，DPO 不能称为 RL 算法，应称之为 off-line RL or SFT++

主题模型

关注

Unigram、LSA、PLSA主题模型 LSA和其SVD实现 PLSA模型及PLSA的EM算法 LDA隐含狄利克雷分布 LDA的python实现及参数选择 LDA主题模型的评估主题模型可视化 LDA的缺陷和改进基于知识的主题模型

关注数：文章数：19 文章阅读量：617926 文章收藏量：1300

作者: -柚子皮-

╰☆ゞ不染纤尘，不忘初心ゞ☆╮

展开

专栏收录文章