1. SAC
SAC是深度强化学习中对于连续动作控制的又一经典algorithm。近期简单的看了一下SAC算法的思想,先把当前的资料整理一波,便于进一步学习。后续再作进一步更新。
1.1文章讨论SAC
- 强化学习算法 SAC
- openAI-soft actor-critic
- Soft Actor-Critic 论文笔记
- 最前沿:深度解读Soft Actor-Critic 算法
- SAC Algorithms and Applications 附可复现代码
- 知乎文章SAC
- 全新的强化学习算法:柔性致动/评价(soft actor-critic,SAC)
- Soft Actor-Critic论文阅读及代码实现
- 最大熵强化学习算法SAC