AI
MC数据局
技艺的至臻境界永无尽头,而苦心孤诣者的姓名必将被历史所铭刻。
展开
-
机器学习常见算法时间复杂度
有了算法复杂度的估计,才有了整个算法更好的优化头绪和方向。1. KNN时间复杂度o(n*k):n为样本数量,k为单个样本特征的维度。如果不考虑特征维度的粒度为o(n)空间复杂度o(n*k):n为样本数量,k为单个样本特征的维度。如果不考虑特征维度的粒度为o(n)参考:https://blog.csdn.net/saltriver/article/details/52502253...转载 2019-04-02 21:12:39 · 4099 阅读 · 0 评论 -
多智能体强化学习入门(五)——QMIX算法分析
https://zhuanlan.zhihu.com/p/55003734转载 2019-04-02 19:56:21 · 2328 阅读 · 6 评论 -
【转载】多智能体强化学习入门(四)——MADDPG算法
https://zhuanlan.zhihu.com/p/53811876转载 2019-04-02 19:53:23 · 1722 阅读 · 2 评论 -
多智能体强化学习入门(三)——矩阵博弈中的分布式学习算法
一、引言多智能体系统一直在学术界或者工业届都是一个热点。其核心领域是关于如何将系统采用分布式的算法控制。在分布式算法中,没有一个中心节点进行总体控制,每个智能体通过与环境交互自己学习自己的最优策略,在不知道全局信息的情况下将策略收敛到纳什均衡点。通常意义下,智能体只知道自身获得的奖励值,不知道环境中的奖励函数,不知道其他智能体的策略,不知道其他智能体获得的奖励。分布式算法主要的核心难点是如何...转载 2019-04-02 19:47:56 · 3204 阅读 · 1 评论 -
多智能体强化学习入门(二)——基础算法(MiniMax-Q,NashQ,FFQ,WoLF-PHC)
转载:https://zhuanlan.zhihu.com/p/53563792一、引言上一篇文章介绍,一个随机博弈可以看成是一个多智能体强化学习过程。其实这两个概念不能完全等价,随机博弈中假定每个状态的奖励矩阵是已知的,不需要学习。而多智能体强化学习则是通过与环境的不断交互来学习每个状态的奖励值函数,再通过这些奖励值函数来学习得到最优纳什策略。通常情况下,模型的转移概率以及奖励函数为止,...转载 2019-04-02 19:45:37 · 6753 阅读 · 0 评论 -
安装ns3-gym,ubuntu下python3
InstallationInstall all required dependencies required by ns-3.# minimal requirements for C++:apt-get install gcc g++ pythonsee https://www.nsnam.org/wiki/InstallationInstall ZMQ and Protoco...转载 2019-04-01 21:18:09 · 2798 阅读 · 12 评论 -
多智能体强化学习笔记 02
最早的探索多智能体强化学习的算法是对Qlearning算法的修改,即Qlearning+博弈均衡。如果对博弈论并不了解直接讲多智能强化学习算法如:极大极小Qlearning;纳什Qlearning,那么大家肯定会很懵,而且把握不住多智能强化学习算法的精髓。另外,真正能学到东西,其实是需要循序渐进的。一下子接触带有很多知识盲点的理论必定会打击你学习的热情和信心,退一步说,就算是硬着头皮啃下来了,也实...转载 2019-04-01 11:58:20 · 2219 阅读 · 1 评论 -
多智能体强化学习笔记 01
跟单智能体强化学习相比,多智能体强化学习的入门似乎更难,想了想觉得有以下几个方面的原因:(1) 多智能体强化学习研究成果较少,没有一本经典的系统的书籍来介绍。而单智能体强化学习算法有本神作,即Sutton的《Reinforcement Learning: An introduction》,有这本神作,足矣。(当然对于入门的中国学生来说,我今年出版的中文书籍《深入浅出强化学习:原理入门》可以作为...转载 2019-04-01 11:57:44 · 2828 阅读 · 0 评论 -
强化学习算法分类及发展趋势
已有的强化学习算法种类繁多,一般可按下列几个标准来分类。(1)根据强化学习算法是否依赖模型可以分为基于模型的强化学习算法和无模型的强化学习算法。这两类算法的共同点是通过与环境交互获得数据,不同点是利用数据的方式不同。基于模型的强化学习算法利用与环境交互得到的数据学习系统或者环境模型,再基于模型进行序贯决策。无模型的强化学习算法则是直接利用与环境交互获得的数据改善自身的行为。两类方法各有优缺点,...转载 2019-03-31 21:56:03 · 4380 阅读 · 0 评论 -
Windows10下基于Unreal Engine的AirSim开发
参考:https://blog.csdn.net/z136411501/article/details/82422645https://www.cnblogs.com/frankfanxinqi/p/8125184.html1. Airsim是一个基于Unreal Engine(虚幻引擎4)的插件,用来模拟无人机或无人车在真实环境下的控制,由微软发布在github平台。链接:htt...原创 2019-01-09 16:25:41 · 1367 阅读 · 0 评论 -
MADDGP代码实现,windows 10可以实现,openai官方代码可实现,已测试
1.我们首先需要进入openai开放的的多智能体环境中,下载安装包,安装openai开源的多智能体环境:https://github.com/openai/multiagent-particle-envs进入到代码主路径中,执行命令安装所需的环境:pip install -e .之后的话它就自动安装好了官方的文章以及代码可以在以下链接中找到:https://github....转载 2019-04-28 19:59:04 · 1240 阅读 · 5 评论