本文内容源自百度强化学习 7 日入门课程学习整理
感谢百度 PARL 团队李科浇老师的课程讲解
目录
1.函数逼近
可数的状态可用Q表格表示,但在实际中的应用状态的数量级十分大,所以可采用值函数近似。
2.神经网络
输入训练数据,输出结果
神经网络可用逼近任意连续函数
神经网络代码举例:
本文内容源自百度强化学习 7 日入门课程学习整理
感谢百度 PARL 团队李科浇老师的课程讲解
目录
可数的状态可用Q表格表示,但在实际中的应用状态的数量级十分大,所以可采用值函数近似。
输入训练数据,输出结果
神经网络可用逼近任意连续函数
神经网络代码举例: