FRL模糊强化学习

ZicMe

已于 2023-07-15 10:36:49 修改

阅读量749

点赞数

分类专栏：强化学习论文笔记文章标签：深度学习机器学习神经网络人工智能

于 2023-07-15 10:35:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_18506857/article/details/131736074

版权

强化学习论文笔记专栏收录该内容

15 篇文章 3 订阅

订阅专栏

FRL模糊强化学习

一句话解释：连续空间映射到离散空间下的强化学习

模糊逻辑（FL）： 在强化学习问题中，将状态空间泛化，并产生连续动作的手段

模糊强化学习分为： Fuzzy Sarsa Learning（模糊Sarsa学习）、 Fuzzy Q-learning (FQL，模糊Q-learning) 、Fuzzy Actor-Critic learning (FACL)

可用于应对维度诅咒： 维度诅咒：Q-learning方法使用表格记录Q值，但在许多现实场景中，观察和行动空间是连续的，高维连续状态空间的表示很麻烦，这个问题被称为维度的诅咒。而应对维度诅咒的一个方式就是将连续空间泛化，即使用模糊逻辑。

ps：由于不是这个方向，在读论文的时候提到了一个模糊强化学习，在网上又搜不到相关解释，就去扒了扒相关论文粗略的了解了下，若有错误欢迎指正。

相关论文推荐

L. Jouffe, “Fuzzy inference system learning by reinforcement methods,”IEEE Trans. Syst., Man, Cybern. C, vol. 28, pp. 338–355, Aug. 1998.

P. Y. Glorennec and J. Jouffe, “Fuzzy Q-learning,” in Proc. 6th IEEE Int.Conf. Fuzzy Systems, 1997.

Fuzzy Sarsa Learning and the proof of existence of its stationary points

上面三篇提出模糊强化学习概念，下面两篇为改进和应用

Online Tuning of Fuzzy Inference Systems Using Dynamic Fuzzy Q-Learning

Supervised fuzzy reinforcement learning for robot navigation

博客推荐

多智能体强化学习博弈系列（1）- 差分博弈和模糊系统 https://blog.csdn.net/yuuyuhaksho/article/details/87702177

多智能体强化学习博弈系列（2）- 模糊Q-Learning https://blog.csdn.net/yuuyuhaksho/article/details/87702919

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
FRL模糊强化学习

Fuzzy Sarsa Learning（模糊Sarsa学习）、 Fuzzy Q-learning (FQL，模糊Q-learning) 、Fuzzy Actor-Critic learning (FACL)、FRL模糊强化学习
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。