强化学习
librahfacebook
爱代码,爱游戏,喜欢一切高端前沿技术
展开
-
DQN:深度强化学习实现人类层次的控制
我们利用最近在训练深度神经网络方面的相关进展,开发出一种新的人工智能代理,被称为深度Q-network,它可以使用端到端的强化学习,直接从高维度传感输入中学习到成功的策略。原创 2019-08-05 16:04:07 · 1719 阅读 · 0 评论 -
使用强化学习的神经架构搜索
本文中我们引入了神经架构搜索,使用一个递归神经网络来组成神经网络架构的想法。通过使用递归网络作为控制器,我们的方法更具灵活性,从而它可以搜索到可变长度的架构空间。我们的方法在具有挑战性的基准上表现出很强的经验性能,对于自动化寻找好的神经网络架构提供了一个新的研究方向。原创 2019-08-06 09:56:45 · 1382 阅读 · 0 评论 -
端边云协作推理相关论文总结
Papers About End-Edge-Cloud Collaborative Inference文章目录Papers About End-Edge-Cloud Collaborative InferencePart 1: Edge ComputingPart 2: Model CompressingPart 3: Reinforcement LearningReferencesPar...原创 2019-08-18 22:20:19 · 4992 阅读 · 3 评论 -
AMC:移动设备上模型压缩和加速的AutoML
本文,我们提出了针对模型压缩的AutoML,称为AMC,它利用强化学习方法来有效地采样设计空间,能够提高模型压缩质量。我们在没有人力作用的情况下,以一种完全自动化的方式获得了先进的模型压缩效果。在4倍浮点数计算量减少的情况下,在ImageNet上的VGG-16模型下,我们获得了比手动调整模型压缩方法更好的2.7%精度提升。原创 2019-08-24 11:01:39 · 1992 阅读 · 0 评论 -
跨边缘设备和云端的分布式推理
我们提出来一个分布式DNN架构,它可以学习端到端如何表示原始传感数据,并通过网络发送数据,以满足最终的传感任务的需求。这样的设计可以很自然地适应传感器和云之间不同的网络带宽,并自动发送适合任务的数据特征。原创 2019-08-12 21:41:12 · 2798 阅读 · 0 评论 -
HAQ:硬件感知自动化量化框架
本文出自论文 HAQ: Hardware-Aware Automated Quantization with Mixed Precision,利用强化学习来自动确定量化策略,并在设计过程中对硬件加速器进行反馈。一、简介传统的量化方法对所有层使用相同的比特数,但是当不同的层有着不同的冗余且在硬件平台上表现有差异性时,对不同的层使用灵活的位宽是很有必要的。然而目前所缺少的部分是如何确定不同硬...原创 2019-07-13 14:51:20 · 5150 阅读 · 0 评论