笔记
BBlue-Sky
这个作者很懒,什么都没留下…
展开
-
强化深度学习的一篇劝退文—有些道理
前言:本文可能有些标题党,并不是真的要完全劝退大家,Alex的本意是希望大家更加冷静地看待目前DRL研究的进展,避免重复踩坑。评论区里有提到因为困难才有做的价值,还有机器人、控制论背景的朋友提到他觉得drl can do anything如果你有正确的超参数,这些意见也很值得大家参考。今天在学校又双叒叕提到了Deep Reinforcement Learning That Matters这篇打响...原创 2020-03-31 08:10:15 · 642 阅读 · 0 评论 -
深度强化学习几大尚未解决问题
收敛困难,调参困难。DRL算法通常需要海量的Agent和环境的交互数据,而这些数据只有在模拟场景下(游戏)才很充足并且廉价,想象一下自动驾驶和机器人领域,如果拿真的汽车和机器人去做Action,万一是负奖赏的Action,那损失也太大点了。奖赏函数需要定义的很准确,这其实很难。最重要的是:很多应用,比较成熟的方法效果都不比DRL差,所以公司不愿意去冒这个风险吧。...原创 2020-03-29 14:30:10 · 1142 阅读 · 0 评论 -
深度强化学习为什么在实际当中用的很少?
深度强化学习(deep reinforcement learning,DRL)是深度学习与强化学习相结合的产物,它集成了深度学习在视觉等感知问题上强大的理解能力,以及强化学习的决策能力,实现了端到端学习。深度强化学习的出现使得强化学习技术真正走向实用,得以解决现实场景中的复杂问题。深度强化学习被认为是通往通用人工智能圣杯的必经之路。但是,事实如何呢?现在,我们刚进入 2020 年,我想看看 20...原创 2020-03-29 14:27:13 · 885 阅读 · 1 评论 -
NoSQL与SQL的区别
关系型数据库1.1什么是关系型数据库关系数据库(Relational database),是创建在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。数据库:包括一个或多个表表(关系 Relation):是以列和行的形式组织起来的数据的集合列(属性 Attribute):在数据库中经常被称为字段行...原创 2020-03-29 14:08:38 · 296 阅读 · 0 评论