自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_21366993的博客

Uranus-。 CSDN认证博客专家 CSDN认证企业博客

码龄10年

12: 原创

117万+: 周排名

8万+: 总排名

7420: 访问

: 等级

208: 积分

51: 粉丝

73: 获赞

10: 评论

66: 收藏

私信

关注

热门文章

分类专栏

强化学习 1篇

最新评论

论文阅读记录 DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning(强化学习+知识图谱+路径推理)
Uranus-。: 不好意思，刚看到，不过我也不太了解。看了一下代码，A.***这三个文件分别是transR,transH,transD做evaluation的时候用到的。就是在做score=h+r-t的计算时，用它对h,r,t分别做个变换，变成score=h*f(A)+r*g(A)-t*f(A),f和g大概是对A的维度变换。 transE做evaluation的时候并没有用到A这样的文件，而是直接计算score=h+r-t。 transE是四个trans方法中最简单的一个，别的三个方法可能在它之上需要用另外一个A矩阵做一些空间变换。
论文阅读记录 DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning(强化学习+知识图谱+路径推理)
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
记录一下对nvidia-smi、nvcc -V、cuda 等things的理解
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
论文阅读记录 DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning(强化学习+知识图谱+路径推理)
青衫如故.: 如果博主看到的话还请博主回复一下，谢谢啦
论文阅读记录 DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning(强化学习+知识图谱+路径推理)
青衫如故.: 比如说vec后缀的文件，vec后缀指的是transH的编码结果，entity2vec.vec和relation2vec.vec分别表示实体和关系的编码结果，A.vec表示谁的transH编码结果呢

最新文章

强化学习

关注

文章平均质量分 67

关注数：文章数：1 文章阅读量：282 文章收藏量：4

作者: Uranus-。

这个作者很懒，什么都没留下…

展开

强化学习Path Consistency Learning(PCL)理解

这篇论文将soft Q-learning算法和文本生成任务联系了起来，论文中提到当前的基于强化学习的文本生成方法会有一个问题：生成文本用到的词表太大（比如5W这样的规模），当用强化学习逐个生成文字时，会导致代理的动作空间很大。首先PCL在强化学习中引入了熵，也就是在代理每一次决定执行的动作时，即要考虑奖励最大化，也要考虑当前步的熵要最大，也就是。具体推导看上面那个zhihu帖子，目前对PCL的理解，就是引入熵满足了随机性，从而在采样的时候能尽量充分的探索动作空间。这一项可以简单理解为单步的熵。

原创 2024-04-26 15:26:36 · 283 阅读 · 0 评论