![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习
文章平均质量分 95
zhugby
这个作者很懒,什么都没留下…
展开
-
深度强化文献阅读系列(一):Courier routing and assignment for food delivery service using reinforcement learning
来源:文章于2022年发表于期刊COMPUTERS & INDUSTRIAL ENGINEERING ,期刊基本信息及影响因子如下图所示:目录摘要1.研究贡献2.文献综述3.问题描述3.1 问题描述3.2 问题假设/前提条件3.3 问题定义4.解决方法4.1 强化学习基本框架4.2 Q-learning4.3 DDQN4.4 Rule Based algorithm5.仿真评估6.实验结果6.1 Q-learning单agent6.2 DDQN单agent vs DDQN6.3 平均收获报酬对比结果6.4原创 2022-06-05 15:36:06 · 368 阅读 · 1 评论 -
强化学习系列(二):Q learning算法简介及python实现Q learning求解TSP问题
目录一、什么是Q learning算法?1.Q table2.Q-learning算法伪代码二、Q-Learning求解TSP的python实现1)问题定义 2)创建TSP环境3)定义DeliveryQAgent类4)定义每个episode下agent学习的过程5) 定义训练的主函数6)实验结果1. 环境创建2.实例化agent类3.agent训练学习一、什么是Q learning算法? Q-learning......原创 2022-05-27 19:48:13 · 7195 阅读 · 56 评论 -
强化学习系列(一):基本原理和概念
目录一、什么是强化学习?二、强化学习的结构第一层第二层第三层三、价值函数1)Policy function:2)Value function:3)Q与V之间的转化3)Q值更新——贝尔曼公式四、强化学习的特点五、强化学习的优点一、什么是强化学习?这几年强化学习在学术界是非常的火热,想必大家或多或少都听过这个名词。什么是强化学习呢?强化学习是机器学习领域的一个分支,指的是agent在与环境的互动过程中为了达成一个目标而进行的学习过程。以...原创 2022-05-27 12:54:34 · 6196 阅读 · 0 评论