直播 NO.5 | Facebook 田渊栋:用深度(强化)学习为组合优化寻找更好的启发式搜索策略...

↑↑↑↑↑点击上方蓝色字关注我们!




『运筹OR帷幄』原创

对这次分享主题感兴趣的小伙伴,

欢迎在文末留言提问,

我们会收集有价值的问题,

请嘉宾在直播中亲自解答。

分享提纲

主题:《用深度(强化)学习为组合优化寻找更好的启发式搜索策略》

嘉宾:田渊栋博士

时间:北京时间 2020年 2月23号(周日) 早 10:00

地点:『运筹OR帷幄』哔哩哔哩直播间

链接:live.bilibili.com/21459168

题目

Learning heuristic with Deep Learning and Reinforcement Learning for combinatorial optimization problems 

简介

本次直播我们有幸请到 Facebook AI Lab 的田渊栋博士,为大家介绍他和团队近期在顶会 NeurIPS 和 ICLR 发表的三篇文章 [1] [2] [3],内容涉及用(深度)强化学习和搜索方法搭配神经网络来寻找复杂优化问题的启发式算法的一些工作。

近年来,深度学习在处理自然数据输入(如计算机视觉、语音识别和自然语言处理)方面成绩斐然。然而,怎样用深度神经网络来处理结构化的数据,(如日志,优化问题的结构化描述,代码),为一些离散优化问题找到一条替代人力启发式策略的神经网络方案,仍然是个未解决的问题。本次直播,我将简要介绍近期我们用强化学习和搜索方法搭配神经网络,来寻找复杂优化问题的启发式算法的一些工作。涉及到的应用领域包括:化简符号表达式、在线事务调度、车辆路径规化、神经网络架构搜索,以及从汇编代码中反编译出C代码。

嘉宾介绍

 

田渊栋博士,脸书(Facebook)人工智能研究院研究员及经理,研究方向为深度强化学习,多智能体学习,及其在游戏中的应用,和深度学习模型的理论分析。曾担任围棋开源项目 DarkForest 及 ELF OpenGo 项目中研究及工程负责人和第一作者。2013-2014年在Google无人驾驶团队任软件工程师。2005年及08年于上海交通大学获本硕学位,2013年于美国卡耐基梅隆大学机器人研究所获博士学位。曾获得2013年国际计算机视觉大会(ICCV)马尔奖提名(Marr Prize Honorable Mentions)。

       

扫描二维码直达『运筹OR帷幄』B 站直播间

对这次分享主题感兴趣的小伙伴,欢迎在文末留言提问,我们会收集有价值的问题,请嘉宾在直播中亲自解答

参考文献:

[1] Chen, X., & Tian, Y. (2019). Learning to perform local rewriting for combinatorial optimization. In Advances in Neural Information Processing Systems (pp. 6278-6289).

[2] Fu, C., Chen, H., Liu, H., Chen, X., Tian, Y., Koushanfar, F., & Zhao, J. (2019). Coda: An end-to-end neural program decompiler. In Advances in Neural Information Processing Systems (pp. 3703-3714).

[3] Wang, L., Xie, S., Li, T., Fonseca, R., & Tian, Y. (2019). Sample-efficient neural architecture search by learning action space. arXiv preprint arXiv:1906.06832.

相关文章推荐

强化学习已经取得像AlphaGo这样举世瞩目的成绩,也成为最近的一个研究热点。组合优化是应用数学、计算机科学、运筹学等领域的重要问题,在调度、资源分配、物流、城市规划、电路设计、制药等领域应用广泛。强化学习与组合优化结合,能产生什么新机会?本次『运筹OR帷幄』社群线上直播,我们有幸邀请到了人工智能公司attain.ai.创始人,加拿大阿尔伯塔大学计算机系博士李玉喜先生,结合具体场景,为我们讲解强化学习在组合优化中的应用。

点击蓝字标题,即可阅读直播回顾 | Attain.ai 创始人李玉喜:强化学习遇见组合优化

往期直播回顾

直播NO.1 | PLM 合伙人李伟:从第一方物流到第五方物流,浅谈物流服务的演进

直播 NO.2 | 胡武华博士:运筹优化理论在物流行业中的应用实践

直播 NO.3 | 滴滴 AI Labs 秦志伟:深度强化学习在网约车交易市场中的应用

直播 NO.4 | 李玉喜博士:强化学习遇见组合优化

文案:p、张长浩

技术:小王

审核编辑:阿春

微信编辑:葡萄

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值