【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中

2e497236e0b775293355070b5f91899d.png

来源:专知

本文约1000字,建议阅读5分钟本教程从可微优化的基础开始,讨论如何将优化转换为可微构建块,以便在更大的体系结构中使用。

5f0680b37827638f42fe197cab040a8f.jpeg

结构信息和领域知识是训练一个好的机器学习模型的两个必要组成部分,以最大限度地提高目标应用中的性能。本教程总结了如何使用优化作为可区分的构建块,将应用程序中的重要操作信息合并到机器学习模型中。

机器学习模型在许多工业应用和社会挑战中取得了重大成功,包括自然语言处理、计算机视觉、时间序列分析和推荐系统。为了适应不同的应用,将应用中的结构信息和领域知识纳入机器学习模型是训练过程中的一个重要元素。但是它经常依赖于微调和特征工程,而没有系统的方法来适应各种应用。另一方面,运筹学是一种应用驱动的方法,优化问题是在目标应用的知识和约束的基础上制定,以导出可操作的解决方案。优化公式在应用中可以捕获结构信息和领域知识,但优化过程的不可微性和复杂的操作过程使其难以集成到机器学习模型中。

本教程从可微优化的基础开始,讨论如何将优化转换为可微构建块,以便在更大的体系结构中使用。可微优化的直接好处是将优化公式中的结构信息和领域知识集成到机器学习模型中。本教程的第一部分涵盖了各种应用,将优化作为机器学习模型中的可微单元,以适当地处理强化学习、控制、最优运输和几何中的操作任务。实验表明,可微优化方法比神经网络更能有效地模拟操作过程。本教程的第二部分侧重于将各种工业和社会挑战作为可区分的优化层集成到训练管道中。这种机器学习模型和应用驱动优化的集成导致端到端学习,以决策为中心的学习,训练模型直接优化目标应用中的性能。最后,本教程总结了可微优化的一系列应用及其计算限制,并为读者提供了各种开放的方向。

https://guaguakai.github.io/IJCAI22-differentiable-optimization/

7bb629076b135d0c0cf126723882afdf.jpeg

84901c024c870c5222f1ac5890edc3f6.jpeg

1c8e99692f4055fdc600f04d91536cf2.jpeg

e14b31bf2c04d30aec4dbce09dce6d96.jpeg

75296075c24f1ac4ac45a3b1a8cb910c.jpeg

9735b336b61dd7f86678881f3f22aeac.jpeg

ad953b23bf043b4db64f23994eed1d02.jpeg

732924498bf8981b52350dff2b46487e.png

5a16de433dec58d2ea9d76f978f9a167.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值