经典的深度强化学习劝退文读后感

最新推荐文章于 2024-09-04 13:47:56 发布

有点可爱的小学僧

最新推荐文章于 2024-09-04 13:47:56 发布

阅读量414

点赞数 1

分类专栏：深度强化学习文章标签：深度学习机器学习

本文链接：https://blog.csdn.net/weixin_42426834/article/details/108315559

版权

深度强化学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

阅读经典的深度强化学习劝退文

今天是来实验室的第一天，我准备重新阅读一下深度强化学习劝退文，以此开始我的科研生活，哈哈，在这里大致写一下相关内容和读后感，也学习一下写博客！

主要阅读文章

’Deep Reinforcement Learning Doesn’t Work Yet’ ，18年2月的爆款文章，深度强化学习经典的劝退文，全文比较长，主要分析了DRL现在存在的一些问题，说了作者认为未来可能的发展方向，非常值得一读，作者Alex Irpan写这篇文的时候是在Google Brain的机器人团队，这里是全文链接和对应的中文翻译：https://www.alexirpan.com/2018/02/14/rl-hard.html ；https://mp.weixin.qq.com/s/_lmz0l1vP_CQ6p6DdFnHWA
“这里有一篇深度强化学习劝退文” ，这是知乎上的一篇文章，主要是对上面文章的精简概况总结，还结合了作者在做深度强化学习的一点感想，也是18年2月底出来的，这篇文章里的评论区还挺值得看一看的，是不同的人对于1中Alex文章的不同见解，这里是链接：https://zhuanlan.zhihu.com/p/33936457 学到一句话，“如不见此文，万古如长夜”，哈哈
“深度学习从入门到出门” ，同样是知乎文，这个标题就很好笑，哈哈哈。这里面不仅分析了深度强化学习的劝退，甚至是对整个AI领域的劝退，时间相对比较老，17年11月的，这里关于强化学习的提到了“Deep Reinforcement Learning that Matters”这篇文章，这个文章在Alex的文章中也有提到，主要是用来说明DRL很难复现，不是很稳定的问题，不过对于一些结论也有一些争议，比如有人认为后面这篇matters的文章里面分析随机种子对算法性能的影响的时候，做的实验次数太少了，不具有说明性。这篇文章有点老了，提到的文章相对更老，有空闲时间可以再看看。链接：https://zhuanlan.zhihu.com/p/31546058
“深度学习劝退” ，知乎again，我住知乎，哈哈。这篇文章比较新了，19年12月底的文章，同样是关于深度学习的劝退，其实也不是劝退，是从作者的角度思考了一下现在的DL研究者应该站在那个角度思考问题，核心思想是"为了深度学习的发展，目前在学界可能更需要懂得深度学习的物理学家，计算机科学家，工程学家，而不是算法科学家；在业界则更需要懂得深度学习的软件工程师，硬件工程师乃至机械工程师，而不是算法工程师。做一个类比的话，如果瓦特蒸汽机已经被发明，那学界和业界可能更需要科学家卡诺(热力循环)和发明家富尔顿(蒸汽轮船)",就是深度学习更像一个技术，要不就去理论处往深走，要不就去辅助其他的传统产业智能化升级，不要局限在互联网和金融行业上，而且考虑到深度学习的入门门槛比较低，其他行业更适合来负责应用这部分，比如懂深度学习的机器人专家，懂深度学习的软件工程师，诸如此类（不过这块是我的理解，未必对），另外这个文章下面的评论也可以看看，这个可真是各个行业对于深度学习甚至是人工智能的理解了，很有启发性。链接：https://zhuanlan.zhihu.com/p/98747125

个人一点点小心得分享

通过阅读这两个政策，我感觉就是其实和上面第四个劝退文还是挺一致的，作为人工智能的从业者，还是应该思考一些人工智能对于社会的意义，同时要关注到人工智能领域一些难啃的硬骨头，要勇于尝试，这样整个行业才会发展得越来越好，现在涌入人工智能这个行业的人才们也才都能更好地发挥自己的才干，智能化社会也才会变成有可能。当然，方向的选择还是要考虑到自身的实际能力和实际情况，博士还是硕士等等，既要仰望星空，也要脚踏实地，就我个人还是想在能力范围内尽可能地往外试探试探，取乎其上，得乎其中。

虽然这篇文章起的名字是DRL的劝退文，但是也不完全是DRL的劝退，也在思考一些人工智能相关的东西，当然学而不思则罔，思而不学则殆，也不能一直思考，还是要多看一些有内容、有理论的东西，多充电，更踏实。现在我对于研究方向有了一些概念了，后续得再和老师们讨论一下，确定了方向后我会写更多关于专业方向的文章，哈哈给自己加油！