DRO和RO的区别

(DRO)是随机优化(Stochastic Programming)与鲁棒优化(Robust Optimization)的结合,将RO中的不确定集合(Uncertainty Set)看做是一个以概率出现的集合,在DRO中叫做Ambiguity Set

 

随机优化(Stochastic Programming 以下简称SP), 鲁棒优化(Robust Optimization 以下简称RO) 是不确定优化的两种paradigms,其它的还包括模糊优化(Fuzzy Programming) 和分布式鲁棒优化(Distributionally Robust Optimization)。SP通常优化一个期望值形式的目标函数,它假定随机参数的概率分布已知(离散类型的参数用scenario tree来表示), 一个典型的SP问题就是newsvendor problem。RO假定随机参数概率分布未知,但知道其波动范围(用uncertainty set定义),目标函数是优化其uncertainty set中最差的情况,即worse-case scenario,对于min问题目标函数为minmax,对于max问题为maximin。

 

优化问题有四大类:传统确定优化问题,随机规划问题,鲁棒优化,分布鲁棒优化

相对于传统确定规划而言,也就是参数都是确定的,比如加工时间确定,运送时间确定,实际生活中,这些值往往是有波动的,就有了不确定优化。

不确定优化一般分为随机规划和鲁棒优化:前者假定参数服从一个分布,一般来说会以期望值为优化目标;后者假定分布未知但是现实中的数据中可以获得一些信息,比如参数出现的所有情况,这就是离散的鲁棒优化,或者是每个参数的取值区间,这就是区间鲁棒优化,而鲁棒优化的目标,可以根据需要的保守程度来制定,如果问题涉及安全,那我们肯定是要不出现任何事故,类似这样的就可以制定绝对目标,优化最差的情况,如果是其他的不需要如此保守的,或许可以制定最优化最大后悔值,等等。

分布鲁棒优化是比较新的研究方向,研究难度相对来说也是大一点点的,结合了随机规划和鲁棒优化,假定参数有多个取值情况,而每一个取值又服从一个分布。

新手入门不确定规划,建议从鲁棒优化的区间类型开始着手。


 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MC数据局

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值