强化学习
RL爱你又恨你
一之濑帆波
这个作者很懒,什么都没留下…
展开
-
策略梯度算法
这个博客讲的比较全面,还没仔细看,先马。博客网站:https://lilianweng.github.io/lil-log/2018/04/08/policy-gradient-algorithms.html原创 2021-08-23 16:09:26 · 73 阅读 · 0 评论 -
ValueError: n_splits=4 cannot be greater than the number of members in each class
使用sklearn中cross_val_score()函数进行K折交叉验证时遇到以下bug:ValueError: n_splits=4 cannot be greater than the number of members in each class错误的原因:设置的折数大于每个类的样本数。目前没解决:自己两个程序里面用的准确率评估一样,pso+q可以使用,pso原始的方法用不了。...原创 2021-04-19 10:16:04 · 2564 阅读 · 0 评论 -
IndexError: only integers, slices (`:`), ellipsis (`...`), numpy.newaxis (`None`) and integer or boo
Bug:IndexError: only integers, slices (:), ellipsis (...), numpy.newaxis (None) and integer or bool出现位置:Q表更新的地方,索引设置不对。解决方法:numpy 处理的时候,注意索引不要用非整数。原创 2021-04-14 10:36:48 · 1541 阅读 · 0 评论