2017年08月_dlphay

12月 11月 10月 09月 08月 07月 06月 05月 04月 02月

原创 RL增强学习在无人驾驶中的应用

csdn公式编辑器不好用，就直接从word里面截图发上来一些理论公式：长期规划问题迷宫：复杂决策的情景----我们只有把基于搜索的和基于增强学习的算法结合，才能有效解决这类问题。围棋：确定性的环境，长期奖励----基于搜索的和基于增强学习的算法结合自动驾驶：环境非确定--转移函数未知自动驾驶简介感知、决策和控制决策：（对安全和可靠性有着严格要求）

2017-08-29 09:49:35 2873

转载 tf.get_variable 和tf.variable_scope

变量共享主要涉及到两个函数：tf.get_variable(name>, shape>, initializer>) 和 tf.variable_scope(scope_name>)。11先来看第一个函数： tf.get_variable。tf.get_variable 和tf.Variable不同的一点是，前者拥有一个变量检查机制，会检测已经存在的变量是否设置为共享变量，如果

2017-08-23 10:08:28 430

转载 NIPS-2013：Playing Atari with Deep Reinforcement Learning

感谢作者的翻译与总结http://blog.csdn.NET/songrotek/article/details/50581011来源：NIPS 2013作者：DeepMind理解基础：增强学习基本知识深度学习特别是卷积神经网络的基本知识创新点：第一个将深度学习模型与增强学习结合在一起从而成功地直接从高维的输入学习控制策略

2017-08-21 20:12:09 3110

原创机器学习相关算法的大总结（四）

目录：1 FP Growth2 Apriori3 GDBT4 LDA5 pLSA

2017-08-02 21:07:18 371

原创机器学习相关算法的大总结（三）

目录：1 正则化2 EM算法3 推荐系统4 异常检查

2017-08-02 21:01:22 368

原创机器学习相关算法的大总结（二）

目录：1 决策树2 朴素贝叶斯3 聚类4 KNN

2017-08-02 20:54:39 309

原创机器学习相关算法的大总结（一）

目录：1 线性回归2 logstic回归3 svm4 boosting

2017-08-02 20:49:21 565

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人