自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Jin的博客

原创【C++笔记整理—第1期】

C++学习笔记第1期，主要回顾了结构体、类的一些简单内容

2024-06-30 11:18:02 641 2

原创【多智能体强化学习03--基于值分解的方法】

本篇主要讲解基于值分解的多智能体强化学习方法，比如VDN,QMIX等。

2024-03-12 14:08:04 1252 1

原创【多智能体强化学习02---训练范式+独立学习+多智能体策略梯度算法】

本篇文章详细介绍了多智能体的训练范式，独立学习算法以及多智能体策略梯度算法

2024-03-11 11:48:39 2643 1

原创【强化学习2--基于策略梯度的方法】

本文全面介绍了基于策略梯度的深度强化学习方法。策略梯度方法适用于连续动作空间问题，直接通过神经网络拟合策略函数。文章着重解释了如何利用策略梯度定理更新策略网络的参数，以最大化预期回报。介绍了REINFORCE算法，该算法通过蒙特卡洛方法估计动作价值函数，并引入状态价值函数作为基线以降低方差。讨论了Actor-Critic方法，该方法结合了策略梯度和值函数更新。进一步，提出了A2C和PPO算法，前者优化了Actor-Critic结构且引入了熵正则化，后者则通过重要性采样简化了算法复杂度。文章通过图表和伪代码清

2024-03-09 15:48:16 1055

原创【强化学习1--基于值的方法】

这篇文章是对强化学习学习思路的一个整理，主要介绍一下DQN算法

2024-03-02 16:15:34 929

原创【多智能体强化学习01---多智能体交互建模】

本篇主要介绍多智能体交互的数学建模，逐渐向MARL过渡

2024-02-25 21:16:44 1073 1

原创全是问题的强化学习—1

本篇是对强化学习的一些思路整理，错误不少，欢迎指正！

2024-02-18 10:17:39 917 1

原创【Git学习-远程仓库高级操作】

本节主要介绍了Git远程仓库操作加参数形式，比如：git push origin master等

2024-02-05 14:08:58 1819 1

原创【Git学习-与远程仓库通信】

本文通过图片展示，介绍了利用Git获取远程仓库最新修改以及推送本地修改到远程仓库的常用命令。

2024-01-30 12:09:33 1015 1

原创 Git学习-高级篇2

本章主要介绍了在Git中移动提交记录的两种方法，以及如何给你的提交记录打标签。

2024-01-28 15:23:32 1000 1

原创 Git学习-高级篇1

Git高级特性学习，本篇主要介绍了git中提交树的分支移动

2024-01-27 12:27:27 1606

原创 Git学习-基础篇

本文旨在用图片的形式直观的介绍git的基本用法，第一节是基础篇，后期持续更新...

2024-01-26 16:29:35 468 1

原创 Python快速入门笔记

python快速入门笔记，可以用来对python的一些基础内容进行回顾

2024-01-07 21:27:34 897 1

论文1：MOBA游戏人机协作

论文1：MOBA游戏人机协作

2024-02-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

AIWhispers CSDN认证博客专家 CSDN认证企业博客

码龄5年

中国科学技术大学

IP 属地：安徽省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

13: 原创

30万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

521: 积分

285: 粉丝

383: 获赞

11: 评论

318: 收藏

私信

关注

热门文章

分类专栏

最新评论

【C++笔记整理—第1期】
Kwan的解忧杂货铺@新空间代码工作室: 博主的文章总是如一盏明灯，指引我前进，你的博文总是充满了深刻见解，对我的学习帮助很大，真的很感激你的辛勤努力。非常感激你的专业知识传授。
【C++笔记整理—第1期】
Jiangxl~: 文章内容丰富、实用性强，结构合理，语言流畅，代码清晰，思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文，也期待博主能来指导一下我的文章
【多智能体强化学习03--基于值分解的方法】
CSDN-Ada助手: 恭喜作者第12篇博客！不断分享多智能体强化学习的知识，对读者们来说是一大福音。在阅读了您的文章后，我觉得下一步您可以考虑添加一些实际案例或者应用场景，以便更好地帮助读者理解和应用所学知识。希望您能继续保持创作的热情，期待您更多精彩的文章！
【多智能体强化学习02---训练范式+独立学习+多智能体策略梯度算法】
CSDN-Ada助手: 恭喜作者第11篇博客的发布！标题中提到的训练范式、独立学习和多智能体策略梯度算法听起来非常有深度和挑战性。希望作者能够继续分享更多关于多智能体强化学习的知识和经验。或许在下一篇博客中，可以结合实际案例或者应用场景，更具体地探讨这些算法在实践中的应用和效果。期待作者的下一篇精彩内容！
【多智能体强化学习01---多智能体交互建模】
CSDN-Ada助手: 恭喜您第8篇博客《【01-多智能体交互建模】》的发布！您的持续创作展现了您对多智能体交互建模的深入思考和研究。接下来，我建议您可以尝试结合实际案例，或是探讨多智能体交互建模在特定行业或领域中的应用，这样可以让您的博客更具实用性和可操作性。期待您更多精彩的创作！

最新文章

提示

确定要删除当前文章？

取消删除