冯·诺伊曼奖得主Jorge Nocedal：增强学习中零阶优化方法及其应用道翰天琼认知智能api机器人接口1。

最新推荐文章于 2024-05-29 21:39:42 发布

认知智能大脑

最新推荐文章于 2024-05-29 21:39:42 发布

阅读量214

点赞数

文章标签：自然语言处理神经网络机器学习深度学习

本文链接：https://blog.csdn.net/m0_47891641/article/details/107216739

版权

美国西北大学教授Jorge Nocedal在2020年北京智源大会上分享了关于零阶优化方法在强化学习中的应用，探讨了在深度学习优化中不依赖梯度信息的优化策略。Nocedal的研究涉及非线性优化，他的工作对于解决图像识别、语音识别等问题具有重要意义。

摘要由CSDN通过智能技术生成

2020年6月22日上午，在第二届北京智源大会全体会议上，冯·诺依曼理论奖得主、美国西北大学教授Jorge Nocedal做了名为《Zero-Order Optimization Methods with Applications to Reinforcement Learning》的主题演讲。

Jorge Nocedal，美国西北大学教授，曾在非线性优化、应用数学和运筹学等领域获得无数奖项。2009年获查尔斯·布罗伊登奖；2010年，他还被评为美国工业和应用数学学会院士；2012年获乔治·B·丹齐格奖；2017年，被授予冯·诺依曼理论奖。2020年当选美国工程院院士。Nocedal主要的研究方向为确定性和随机性设置中的非线性优化，他目前进行的算法和理论研究的动机源于图像、语音识别、推荐系统和搜索引擎中的非线性优化问题。

Nocedal在演讲中指出，在函数优化的过程中，我们通常可以使用梯度下降的方法来获得目标函数的最值，但其实这需要依赖许多最值搜索的“运气”，其中包括：良好的初始化、步长、迭代方向计算的精度、搜索空间的结构等，但是在深度学习中，尤其是增强学习中，这些“运气”并不一定可以满足，那么我们如何通过其他的方法来做深度学习中目标函数的优化呢，本次会议中Nocedal给我们分享了他的独到思路——零阶优化。所谓零阶优化算法即不利用一阶导数信息，在一定次数的抽样基础上，拟合目标函数的最值。零阶优化方法通过对目标函数逼近或对目标函数加罚函数的方法，将约束的优化问题转换为非约束的优化问题。

认知智能是计算机科学的一个分支科学，是智能科学发展的高级阶段&

最低0.47元/天解锁文章

认知智能大脑

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
冯·诺伊曼奖得主Jorge Nocedal：增强学习中零阶优化方法及其应用道翰天琼认知智能api机器人接口1。

2020年6月22日上午，在第二届北京智源大会全体会议上，冯·诺依曼理论奖得主、美国西北大学教授Jorge Nocedal做了名为《Zero-Order Optimization Methods with Applications to Reinforcement Learning》的主题演讲。Jorge Nocedal，美国西北大学教授，曾在非线性优化、应用数学和运筹学等领域获得无数奖项。2009年获查尔斯·布罗伊登奖；2010年，他还被评为美国工业和应用数学学会院士；2...
复制链接

扫一扫