AI
文章平均质量分 78
流萤点火
web开发;区块链Fabric;安全强化学习。笔记,踩坑记录,经验分享。欢迎讨论
展开
-
深度强化学习——DQN算法原理
深度Q网络与Q学习的目标价值以及价值的更新方式都非常相似。主要的不同在于:深度Q网络将Q学习与深度学习结合,用深度网络来近似动作价值函数,而Q学习则是采用表格存储;深度Q网络采用经验回放的训练方式,从历史数据中随机采样,而Q学习直接采用下一个状态的数据进行学习。原创 2022-11-14 19:58:12 · 58487 阅读 · 11 评论 -
强化学习——Q-Learning算法原理
强化学习——Q-Learning算法原理原创 2022-11-12 15:34:40 · 10480 阅读 · 2 评论 -
运行gym库动画窗口渲染不出来
运行gym库动画窗口渲染不出来原创 2022-11-09 22:28:36 · 5975 阅读 · 12 评论