- 博客(3)
- 收藏
- 关注
原创 DDPG算法实现multiple particle env的‘simple’ scenario
simple简介:simple是multi particle envs(mpe)中最简单的一个环境,旨在测试算法和熟悉环境,我在mpe中使用DDPG算法完成了单智能体的navigation的功能。DDPG算法是基于AC算法的改进版本,加入了target网络保证收敛,同时可以输出连续动作,具体不再赘述,不懂可以去看莫烦老师的强化学习教程下面看代码# -*- coding: utf-...
2019-02-26 10:27:54 1093 1
转载 tensorflow中feed_dict不一定与placeholder绑定
在tensorflow的初学者看来,feed_dict是与placeholder绑定的,如下import tensorflow as tfa = tf.placeholder(dtype=tf.float32)b = tf.placeholder(dtype=tf.float32)c = tf.add(a, b)with tf.Session() as sess: pri...
2019-02-25 10:55:01 456
原创 决策树Python实现代码
引用数据集获取:西瓜数据集2.0获取程序:# -*- coding: utf-8 -*-"""Created on Sun Jan 6 23:02:02 2019@author: Jack Lee"""import mathdef createDataSet(): dataSet = [ # 1 ['青绿', '蜷缩', ...
2019-01-08 18:12:38 703
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人