强化学习基础
文章平均质量分 87
玉方知
大家一起学习!
展开
-
强化学习篇之马尔科夫决策过程
《强化学习篇之马尔科夫决策过程》 文章目录《强化学习篇之马尔科夫决策过程》前言一、马尔科夫决策过程(MDPs)是什么?1.马尔科夫的由来2.MDPs基本内容:3.MDPs:二、马尔科夫决策过程(MDPs)数学表示 前言 强化学习是机器学习的领域之一,其重点是给定的主体在一个环境中,为了获得更大的回报,可能采取的行动。而马尔科夫决策过程是强化学习的基础,其为我们提供了一种形式化的方法——顺序决策。 提示:本系列文章为学习强化学习过程中的笔记梳理,欢迎指正! 一、马尔科夫决策过程(MDPs)是什么?原创 2021-10-23 22:25:17 · 507 阅读 · 0 评论 -
使用tensorflow进行简单的强化学习 1—Q-learning
注:该系列文章为学习笔记,欢迎指正! 文章目录 前言 一、Q-learning 1.FrozenLake 环境 二、使用步骤 1.引入库 2.读入数据 总结 前言 大家听说的可以玩 Atari 游戏的 Deep Q-Networks 是Q-Learning 算法的更大、更复杂的实现。所以在学习DQN之前,我们需要对Q-learning有一定的了解。 一、Q-learning 概述:Q-learning为一种针对表格环境的表格方法。 与试图学习如何通过函数定义将观..原创 2021-11-12 16:17:43 · 3457 阅读 · 0 评论