机器学习
留下自己机器学习中的心得体会
随意凯
这个作者很懒,什么都没留下…
展开
-
PyG安装出现libcusparse.so.11: cannot open shared object file: No such file or dir解决方法【亲测有效】
原文原创 2022-04-12 14:37:39 · 1741 阅读 · 1 评论 -
PyG自定义数据集
链接原创 2022-01-03 09:54:05 · 686 阅读 · 0 评论 -
Constrained Policy Optimization解读
Constrained Policy Optimization使用信任区域代替策略散度惩罚,从而得到更大的步长,对于只有一个线性约束的问题,也有对应的解决方案,看paper吧,太难了。。问题的形式化定义推荐中的CDMP在每个时间戳(t1,t2,t3…,t4),一个用户发送一个请求到推荐系统,推荐智能体G会将当前用户特征表征和候选物品I作为输入,生成一个物品列表L作为推荐,用户u收到物品列表L会给出自己的反馈B(比如点击物品),因此,状态s可以令用户特征表示,动作a可以用物品列表L表示,奖赏r是即刻奖原创 2021-11-12 08:18:15 · 1206 阅读 · 0 评论