经典的深度强化学习劝退文读后感

阅读经典的深度强化学习劝退文

今天是来实验室的第一天,我准备重新阅读一下深度强化学习劝退文,以此开始我的科研生活,哈哈,在这里大致写一下相关内容和读后感,也学习一下写博客!

主要阅读文章

  1. ’Deep Reinforcement Learning Doesn’t Work Yet’ ,18年2月的爆款文章,深度强化学习经典的劝退文,全文比较长,主要分析了DRL现在存在的一些问题,说了作者认为未来可能的发展方向,非常值得一读,作者Alex Irpan写这篇文的时候是在Google Brain的机器人团队,这里是全文链接和对应的中文翻译:https://www.alexirpan.com/2018/02/14/rl-hard.html ;https://mp.weixin.qq.com/s/_lmz0l1vP_CQ6p6DdFnHWA
  2. “这里有一篇深度强化学习劝退文” ,这是知乎上的一篇文章,主要是对上面文章的精简概况总结,还结合了作者在做深度强化学习的一点感想,也是18年2月底出来的,这篇文章里的评论区还挺值得看一看的,是不同的人对于1中Alex文章的不同见解,这里是链接:https://zhuanlan.zhihu.com/p/33936457 学到一句话,“如不见此文,万古如长夜”,哈哈
  3. “深度学习从入门到出门” ,同样是知乎文,这个标题就很好笑,哈哈哈。这里面不仅分析了深度强化学习的劝退,甚至是对整个AI领域的劝退,时间相对比较老,17年11月的,这里关于强化学习的提到了“Deep Reinforcement Learning that Matters”这篇文章,这个文章在Alex的文章中也有提到,主要是用来说明DRL很难复现,不是很稳定的问题,不过对于一些结论也有一些争议,比如有人认为后面这篇matters的文章里面分析随机种子对算法性能的影响的时候,做的实验次数太少了,不具有说明性。这篇文章有点老了,提到的文章相对更老,有空闲时间可以再看看。链接:https://zhuanlan.zhihu.com/p/31546058
  4. “深度学习劝退” ,知乎again,我住知乎,哈哈。这篇文章比较新了,19年12月底的文章,同样是关于深度学习的劝退,其实也不是劝退,是从作者的角度思考了一下现在的DL研究者应该站在那个角度思考问题,核心思想是"为了深度学习的发展,目前在学界可能更需要懂得深度学习的物理学家,计算机科学家,工程学家,而不是算法科学家;在业界则更需要懂得深度学习的软件工程师,硬件工程师乃至机械工程师,而不是算法工程师。做一个类比的话,如果瓦特蒸汽机已经被发明,那学界和业界可能更需要科学家卡诺(热力循环)和发明家富尔顿(蒸汽轮船)",就是深度学习更像一个技术,要不就去理论处往深走,要不就去辅助其他的传统产业智能化升级,不要局限在互联网和金融行业上,而且考虑到深度学习的入门门槛比较低,其他行业更适合来负责应用这部分,比如懂深度学习的机器人专家,懂深度学习的软件工程师,诸如此类(不过这块是我的理解,未必对),另外这个文章下面的评论也可以看看,这个可真是各个行业对于深度学习甚至是人工智能的理解了,很有启发性。链接:https://zhuanlan.zhihu.com/p/98747125

相关政策学习

因为最近我也在思考方向,所以还阅读了一些中美有关人工智能的政策,这里也分享一下吧

  1. 《新一代人工智能发展规划》,国务院17年7月发布的文章,其中的第三大点重点任务里面,对于我国人工智能要重点研发的人工智能方向都做了介绍,比如大数据,感知等等,另外整个规划也强调了人工智能要服务于产业,服务于社会,帮助产业升级,帮助教育医疗等等。所以这个规划对于个人思考今后的事业发展还是很有帮助的,也很有启发。我觉得人在思考方向的时候,要首先关注有没有意义,再关注可不可行,社会的智能化是一件很值得期待的事情,当然从当前的智能水平跨越到通用人工智能还有很长的一段路要走,还有许多需要攻坚克难的事情,但是研究者们还是不要畏难,迎难而上,真正的时代终有一天会到来,“功成不必在我,功成必定有我”。而且对于以后致力于去工业界贡献力量的同学,适当地思考一下自己的研究方向该如何应用,对自己的研究方向还是有一定的指导意义的。这里是链接:http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm
  2. DARPA人工智能研究情况,这个是关于美国国防部高级研究计划局DARPA关于人工智能研究情况的一个介绍,也是17年前后就有了,DARPA认为人工智能分为三次浪潮:手工知识,统计学习和上下文推理,分别涉及人工设计逻辑,专家系统;数据驱动学习知识;以及考虑到统计学习只用到了相关性的信息,进一步挖掘其他因果关系,增强智能体的推理属性相关的研究。DARPA在当时将准备开展两个方面的研究,分别侧重在可解释性和终身学习上,可解释性就更安全,更可控,终身学习感觉是更通用智能的研究。

个人一点点小心得分享

通过阅读这两个政策,我感觉就是其实和上面第四个劝退文还是挺一致的,作为人工智能的从业者,还是应该思考一些人工智能对于社会的意义,同时要关注到人工智能领域一些难啃的硬骨头,要勇于尝试,这样整个行业才会发展得越来越好,现在涌入人工智能这个行业的人才们也才都能更好地发挥自己的才干,智能化社会也才会变成有可能。当然,方向的选择还是要考虑到自身的实际能力和实际情况,博士还是硕士等等,既要仰望星空,也要脚踏实地,就我个人还是想在能力范围内尽可能地往外试探试探,取乎其上,得乎其中。

虽然这篇文章起的名字是DRL的劝退文,但是也不完全是DRL的劝退,也在思考一些人工智能相关的东西,当然学而不思则罔,思而不学则殆,也不能一直思考,还是要多看一些有内容、有理论的东西,多充电,更踏实。现在我对于研究方向有了一些概念了,后续得再和老师们讨论一下,确定了方向后我会写更多关于专业方向的文章,哈哈给自己加油!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值