机器学习
文章平均质量分 83
天寒心亦热
每天努力一点点,坚持就是胜利!
展开
-
机器学习-模型评估与选择(第2章)课后习题
机器学习-模型评估与选择(第2章)课后习题原创 2023-09-20 18:26:02 · 746 阅读 · 0 评论 -
强化学习(2)
强化学习(2)多智能体深度强化学习重要性采样;深度强化学习中的Fingerprints;VPG is an on-policy algorithm;The Spinning Up implementation of VPG supports parallelization with MPI.;幂长度表示所有训练智能体在环境中的每个幂的平均长度;策略损失表示损失函数的平均幅度,与策略(决定操作的过程)变化的程度相关;值损失:价值函数更新的平均损失;策略熵:表示模型的决策随机性原创 2023-08-29 22:50:14 · 610 阅读 · 0 评论 -
强化学习(1)
强化学习原创 2023-03-22 13:38:35 · 254 阅读 · 0 评论