State-wise Safe Reinforcement Learning: A Survey 本文主要将安全强化学习分成了在收敛后安全的保证以及训练期间的安全性的保证,本文作者深入探讨了针对这两方面研究方法以及其优缺点。图片是其思维导图