如果是网格空间的话,我们可以将它通过切分离散化
另一种方式是Tile Coding,将不同的tile叠加在状态上,并给他们分配一个位,如果智能体正在某个位置上,可以将新的离散化状态表示为位向量,激活的位置为1,其它位置为0
adaptive tile coding不需要我们手动指定离散化方式
coarse coding使用一组更稀疏的特征来表示状态空间,构建一个位向量,这些圆圈用1表示,剩余圆圈用0表示,圆圈越小空间的泛化程度就越低,形成不太平缓的值函数
强化学习&连续空间5.2 | 离散化
最新推荐文章于 2022-08-21 11:04:14 发布
![](https://img-home.csdnimg.cn/images/20240711042549.png)