- 博客(7)
- 收藏
- 关注
原创 RL增强学习在无人驾驶中的应用
csdn公式编辑器不好用,就直接从word里面截图发上来一些理论公式:长期规划问题迷宫:复杂决策的情景----我们只有把基于搜索的和基于增强学习的算法结合,才能有效解决这类问题。围棋:确定性的环境,长期奖励----基于搜索的和基于增强学习的算法结合自动驾驶:环境非确定--转移函数未知自动驾驶简介感知、决策和控制决策:(对安全和可靠性有着严格要求)
2017-08-29 09:49:35 2873
转载 tf.get_variable 和tf.variable_scope
变量共享主要涉及到两个函数:tf.get_variable(name>, shape>, initializer>) 和 tf.variable_scope(scope_name>)。11先来看第一个函数: tf.get_variable。tf.get_variable 和tf.Variable不同的一点是,前者拥有一个变量检查机制,会检测已经存在的变量是否设置为共享变量,如果
2017-08-23 10:08:28 430
转载 NIPS-2013:Playing Atari with Deep Reinforcement Learning
感谢作者的翻译与总结http://blog.csdn.NET/songrotek/article/details/50581011来源:NIPS 2013作者:DeepMind理解基础:增强学习基本知识深度学习 特别是卷积神经网络的基本知识创新点:第一个将深度学习模型与增强学习结合在一起从而成功地直接从高维的输入学习控制策略
2017-08-21 20:12:09 3110
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人