Artificial Intelligence
文章平均质量分 73
songrotek
深度增强学习DRL,机器人researcher
展开
-
Deep Learning for Robotics 资源汇总
Deep Learning for Robotics 各种资源汇总包含Deep Learning,Computer Vision,Robotics,Reinforcement Learning原创 2015-06-11 09:29:58 · 3896 阅读 · 0 评论 -
OpenAI Gym 关于CartPole的模拟退火解法
前言今天测试OpenAI Gym,然后发现CartPole的最快实现快到离谱,使用Simulated Annealing,也就是SA模拟退火法。效果如下图: 代码地址:模拟退火解CartPole于是好好研究了一下。关于模拟退火法一种最优控制算法,基本思想就是每次找一个邻近的点(解法),如果邻近的点比较优,就接受这个点,但是下一次使用随机有一定概率继续选择新的邻近的点,从而避免局部最优,从而通过多次原创 2016-05-03 21:38:01 · 7943 阅读 · 0 评论 -
DRL前沿之:End to End Learning for Self-Driving Cars
前言如果大家关注上个月Nvidia GTC,那么大家应该会注意到Nvidia 老大黄仁勋介绍了他们自家的无人驾驶汽车,这个汽车的无人驾驶技术和以往的方法不一样,完全采用神经网络。这个系统取名为DAVE。 NVIDIA GTC Self-Driving Car 上面的视频需翻墙观看。很庆幸的是,就在上周,Nvidia发表了他们的文章来介绍这个工作: http://arxiv.org/abs/16原创 2016-05-03 10:21:26 · 9419 阅读 · 2 评论 -
你是这样获取人工智能AI前沿信息的吗?
前言对于Researchers或者Geeks而言,特别是并没有在顶级的科研圈里的人,如何高效的获取最新的科技前沿,对自己的研究方向,定位是非常重要的。对于比如人工智能的入门者而言,确定方向更是重中之重。本人自己的经历发现常常相对旁人总能第一时间获取最新的技术前沿(显然也会漏到很多)。然后觉得获取信息或许也是一种能力,值得去探索。那么下面我就分享一下个人是如何收集前沿信息的,班门弄斧,请批评指正!Ti原创 2016-04-16 14:06:41 · 9280 阅读 · 4 评论 -
了解点OpenAI及深度学习研究前沿
前言OpenAI是2015年底刚成立的人工智能公司,由Elon Musk领投,号称有10亿美金的投资额,由几位人工智能的顶尖好手组成。这基本上意味着一个新的DeepMind公司诞生,只不过这次OpenAI是一个组织,不属于任何一个公司。为什么要了解OpenAI?因为OpenAI的研究内容很大程度上代表着人工智能的研究方向,由于其非盈利性质以及地处加州硅谷这种黄金地段,未来聚集更多顶尖人才的可能性很大原创 2016-04-14 09:07:32 · 17060 阅读 · 4 评论 -
了解点Jurgen Schmidbuber
前言 可能很多童鞋都知道Andrew Ng,但并不是很多人知道Jurgen Schmidbuber。但在我看来,这位大神真的的超神。由于RNN,LSTM的兴起,Jurgen Schmidbuber开始走入到我们的视线。深入了解一下,发现他的研究超乎想象的前沿。 他的网站:http://people.idsia.ch/~juergen/ 他的Google+:https://plus.google原创 2016-04-13 09:34:40 · 2309 阅读 · 0 评论 -
深度解读 AlphaGo 算法原理
深度解读AlphaGo原创 2016-04-05 22:07:17 · 87935 阅读 · 16 评论 -
AlphaGo来了,终结者不远了
前言2016年3月9日,这注定是载入史册的一天。在不被大部分人看好的情况下,AlphaGo第一局就胜了李世石,第二局的胜利更是让很多围棋高手目瞪口呆。接下来的5:0就是时间问题了。AlphaGo的胜利到底意味着什么?不同人总有不同的观点。对于很多不了解AlphaGo原理的普通观众而言,会感觉智能来了,机器人要统治世界了,细思极恐。而以此同时,一些研究人工智能的专家们,绝大多数可能根本没有认真看原创 2016-03-12 21:29:43 · 3135 阅读 · 3 评论 -
Deep Reinforcement Learning 深度增强学习资源
1 学习资料增强学习课程 David Silver (有视频和ppt):http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html最好的增强学习教材:Reinforcement Learning: An Introductionhttps://webdocs.cs.ualberta.ca/~sutton/book/the-book.html 深原创 2016-01-24 10:35:12 · 21788 阅读 · 4 评论 -
深度学习之Matlab 转C++在iOS上测试CNN手型识别
1 前言在上一篇Blog,我介绍了在iOS上运行CNN的一些方法。但是,一般来说,我们需要一个性能强劲的机器来跑CNN,我们只不过需要将得到的结果用于移动端。之前在Matlab使用UFLDL的代码修改后跑了手型识别的3层CNN,这里我们就考虑将Matlab转C之后移植到xcode中。Step 1:Matlab 转c首先要保证代码可以跑,可以运行,比如我这边,如下测试cnn识别手型: >> para原创 2015-07-20 11:11:06 · 6547 阅读 · 9 评论 -
Python 之 使用Tkinter 做GUI 研究机器人走迷宫
这本是课程的一个作业研究搜索算法,当时研究了一下Tkinter,然后写了个很简单的机器人走迷宫的界面,并且使用了各种搜索算法来进行搜索,如下图: 使用A*寻找最优路径: 由于时间关系,不分析了,我自己贴代码吧。希望对一些也要用Tkinter的人有帮助。from Tkinter import *from random import *import timeimport numpy as原创 2015-08-27 10:09:44 · 5727 阅读 · 0 评论 -
深度学习之在iOS上运行CNN
1 引言作为曾经的iOS开发者,在研究深度学习的时候,总有一个想法就是在iPhone上运行深度学习,不管是在手机上训练还是利用训练好的数据进行测试。 因为iOS的开发环境支持C++,因此,只要你的代码是C/C++,本质上就可以在iOS上运行。 怎么才能更快更好地在iOS上运行CNN呢?2 方法1:通过Matlab转码Matlab自带转成c的工具,如果你研究过UFLDL的深度学习教程,就知道如何在原创 2015-07-14 21:34:53 · 12511 阅读 · 3 评论 -
解密Google Deepmind AlphaGo围棋算法:真人工智能来自于哪里?
2016年1月28日,Google Deepmind在Nature上发文宣布其人工智能围棋系统AlphaGo历史性的战胜人类的职业围棋选手!这条重磅新闻无疑引起了围棋界和人工智能界的广泛关注!3月份AlphaGo对阵李世石的比赛更将引起全人类的目光!是什么使围棋算法产生了质的飞跃?要知道,在之前最好的围棋程序也只能达到业余人类棋手的水平。是真的人工智能产生了吗?对于大多数人来说,大家都知道1997原创 2016-01-30 16:53:44 · 46318 阅读 · 10 评论