- 博客(2)
- 资源 (15)
- 收藏
- 关注
原创 reinforcement learning,增强学习:Exploration and Exploitation
最后两节课分别将bandits和games,基本上是保证课程的完整性,很多内容比较复杂,这里只提一些思想。 Lecture 9: Exploration and Exploitation Online decision-making involves a fundamental choice: Exploitation Make the best decision gi
2016-12-05 17:12:06 2250
原创 reinforcement learning,增强学习:Integrating Learning and Planning
好长时间没跟新了,这期间有好多事情(华为、微博、算法课),现在把最后几节课拾起来。 上节课内容和本节课内容 1)Model-Free和Model-Based的区别: Model-Free RL: No model Learn value function (and/or policy) from experience Model-Based RL
2016-12-04 09:58:52 2364
dblp测试数据集
2016-03-26
entity linking源码
2016-01-17
机器学习数据集,20news-bydate.rar
2015-09-06
java读xml文件jar包
2015-08-22
javaweb连接数据库包mysql-connector-java-5.1.27-bin.jar
2015-08-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人