RL
三少Algorithm
个人知乎:https://www.zhihu.com/people/ma-zong-3/activities
展开
-
强化学习:CartPole
欢迎加群:1012878218,一起学习、交流强化学习,里面会有关于深度学习、机器学习、强化学习的各种资料 。 强化学习(Reinforcement Learning),是机器学习的一个分支,解决连续策略问题。区别于无监督学习(如聚类,kmeans,自编码器)和有监督学习(分类和回归,CNN,RNN,LSTM),强化学习的目标变化不明确,不存在绝对的正确标签。 强化学...原创 2019-03-27 19:47:02 · 3015 阅读 · 0 评论 -
基于强化学习求解组合优化问题TSP
A Note on Learning Algorithms for Quadratic Assignment with Graph Neural Networks:使用图神经网络解TSPOptimization on a Budget A Reinforcement Learning Approach:介绍强化学习方法在预算优化中的应用Pointer Network:首次提出了...原创 2019-04-14 13:44:34 · 14293 阅读 · 0 评论 -
强化学习:DP
欢迎加群:1012878218,一起学习、交流强化学习,里面会有关于深度学习、机器学习、强化学习的各种资料 。术语动态规划(DP)指的是一组算法,可以用来计算最佳策略,给定一个作为马尔可夫决策过程(MDP)的完美环境模型。 经典的DP算法在强化学习中的作用有限,因为它们都假设了一个完美的模型,并且由于它们的计算耗费巨大,但它们在理论上仍然很重要。 DP为理解本书其余部分介绍的方法提供了必要的基...原创 2019-04-19 16:06:54 · 887 阅读 · 0 评论