强化学习
文章平均质量分 96
本专栏用以记录在强化学习方面的理论及实践,欢迎交流~
Lins号丹
喜欢爬山的运筹算法工程狮
展开
-
安装conda并搭建python环境(入门教程)
介绍了什么是conda,以及如何利用conda管理包和python环境原创 2024-05-12 20:29:52 · 1538 阅读 · 2 评论 -
Windows10系统中安装与配置PyTorch(无GPU版本)
介绍了在windows系统上安装CPU版本的PyTorch原创 2024-06-02 21:52:31 · 1227 阅读 · 3 评论 -
强化学习(一)基础概念入门
介绍了强化学习的基本概念,以及常见算法的分类原创 2024-04-12 14:03:18 · 1035 阅读 · 0 评论 -
强化学习(二)马尔科夫决策过程 MDP
介绍了马尔可夫过程的相关概念,并用实例展示如何求解最优价值函数原创 2024-04-12 19:56:57 · 1186 阅读 · 0 评论 -
强化学习(三)基于动态规划 Dynamic Programming 的求解方法
介绍了动态规划与强化学习的关系,并用例子详细演示了动态规划如何求解策略评估、策略迭代问题原创 2024-04-16 19:30:30 · 1139 阅读 · 0 评论 -
强化学习(四)基于蒙特卡罗算法 Monte-Calo 的求解
介绍了如何用蒙特卡洛求解最优价值函数,并用Python代码示例进行了演示原创 2024-04-17 19:03:22 · 851 阅读 · 0 评论 -
强化学习(五)基于时序差分法 TD 的求解
介绍了如何用时序差分法求解最优价值函数,并举例演示了时序差分在线控制算法SARSA的计算过程原创 2024-04-24 19:49:22 · 1061 阅读 · 0 评论 -
【项目案例】利用强化学习训练“井字棋”下棋策略的详细介绍
基于Python介绍了如何用强化学习训练井字棋游戏的案例原创 2024-04-10 14:56:20 · 1074 阅读 · 0 评论 -
【项目案例】基于强化学习Q-Learning训练“汉诺塔Tower of Hanoi”游戏策略
基于强化学习的基础值迭代算法Q-Learning,演示了如何针对简单的汉诺塔游戏训练出一个成功的策略原创 2024-04-19 15:24:49 · 1319 阅读 · 0 评论