强化学习
文章平均质量分 75
Ceder1c
Hi there!
展开
-
d4rl修改默认数据集位置
即在环境变量D4RL_DATASET_DIR没有定义的情况下,默认为~/.d4rl/datasets。将数据集迁移至指定地点,需要设置系统环境变量。原创 2023-06-04 15:43:46 · 270 阅读 · 0 评论 -
多智能体强化学习思路整理
本篇将首先简要地介绍多智能体强化学习(Multi-agent Reinforcement Learning, MARL)的相关理论基础,包括问题的定义、问题的建模,以及涉及到的核心思想和概念等。然后,简要阐述解决各类多智能体问题的经典算法。最后,对目前多智能体强化学习技术的应用进行总结。原创 2022-11-27 20:22:42 · 1539 阅读 · 0 评论 -
基于stable-baselines3的PPO和DQN训练LunarLander-v2
基于stable-baselines3的PPO和DQN训练LunarLander-v2原创 2022-06-26 23:07:40 · 3933 阅读 · 0 评论 -
Q-Learning, Double DQN与 Dueling DQN算法详解
Q-Learning, Double DQN与 Dueling DQN算法详解原创 2022-06-22 17:57:09 · 756 阅读 · 0 评论 -
Policy Gradient (PG)与Proximal Policy Optimization (PPO)算法详解
Policy Gradient (PG)与Proximal Policy Optimization (PPO)算法详解原创 2022-06-21 20:35:14 · 1423 阅读 · 0 评论