编写一个强化学习中的Q learning算法的代码,运行报错:
开头表示‘argmax’已经被丢弃,需要使用‘idxmax’代替,照做以后还是出现下面错误:
用idxmax函数去求series类型的最大值的索引,一行行测试都是一个满足idxmax函数要求的参数类型,都是标准的Series类型,且每个元素都是浮点数
最后发现是DataFram中的元素类型出现,我在其后添加.astype(‘float64’)运行就没有报错了!!!
self.q_table = pd.DataFrame(columns=self.actions).astype('float64')
最后解决办法借鉴博客:https://www.cnblogs.com/loubin/p/11315446.html