因为做本科毕业论文,所以看了一些关于随机规划的论文,与大家分享。
最近看了中科院大学王晓老师发表在SIAM上的一篇关于随机惩罚方法的论文,主要讲随机惩罚逼近方法,名字是Penalty methods with stochastic approximation for stochastic nonlinear programming。
随机规划问题在应用方面可以用来最小化机器学习中的损失函数等等一些。
随机非线性规划问题可以根据目标函数的形式分为两类,一类是目标函数可以直接写出来的,例如最小化一个函数 f(x)=x2+1 ,在这里f是有确切的、明确的表达式的;另一类是我们不知道目标函数的确切表达式,这意味着我们不知道目标函数的在某个点(例如点 x 处)的函数值和梯度值。但是