【CMU博士论文】算法和架构的学习

189a7a0267b8ab60d4ba2f55ce2c45ba.png

来源:专知
本文为论文介绍,建议阅读5分钟
本论文利用机器学习、算法设计和优化的思想,推动我们对这些数据驱动计算领域的理解——元学习、具有预测的算法和架构搜索——并将结果方法论转化为最先进的实现。

3f072bf44e3db9b884aa6d1ff884e9b9.png

我们应该如何设计我们运行的算法和学习的架构?计算领域的多个高影响力领域已经开始使用机器学习(ML)自动化这些程序,通过利用我们不断扩大的数据和计算资源,减少对人力的需求。本论文利用机器学习、算法设计和优化的思想,推动我们对这些数据驱动计算领域的理解——元学习、具有预测的算法和架构搜索——并将结果方法论转化为最先进的实现。

  • 在元学习中,我们利用机器学习自身来改善 ML 算法,通过跨多个学习任务进行学习,我们引入了 ARUBA,一个用于设计和分析元学习方法的框架。我们的分析提供了基于梯度的元学习的首次保证,展示了这些方法如何根据可量化的学习任务相似性指标提高性能。我们利用 ARUBA 将元学习的实际影响扩展到机器学习的新领域,包括部分反馈学习和联邦学习;在后者中,我们引入了 FedEx,一种用于调优联邦优化器的新型最先进方法,该优化器在分布式异构数据集(如移动设备和医院记录)网络上训练模型。

  • 我们在 ARUBA 成功的基础上,进一步扩展其核心方法——优化近似算法目标的替代损失函数——不仅限于学习算法,还展示了具有预测的算法的学习保证,即利用机器学习预测其实例的算法;特别地,我们展示了依赖于算法运行实例的预测的首个学习理论保证,这对实际应用至关重要。我们的框架再次作为算法设计工具,构建了第一个针对释放(差分)隐私统计信息的算法和线性系统求解器的具有预测的算法;在后者中,我们设计的学习算法在自然结构假设下,可以学习到实例最优的预测。

  • 最后,本论文解决了在特定学习任务上训练神经网络架构的问题,即架构搜索,我们朝着理解权重共享的优化和泛化特性取得了进展,权重共享是该领域使用的主要启发式方法。然后,我们扩展了权重共享,以设计基于神经操作的新搜索空间,允许从数据中自动发现真正新颖的架构;这一努力的顶点是 DASH,一种有效找到在我们测试的大多数多样化任务上超越人类专家设计的神经架构的方法。

dbd6a957c6e2686d8a102befb2f7291a.png

9da3d2290a5c1e728dfa6f1c620058f4.png

关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。

693a0d3ae4d03e21d1b69b4d7bea5d9f.png

新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值