决策理论

本文深入探讨决策理论,涵盖效用、决策准则、贝叶斯决策和多目标决策等方面。介绍了效用函数的估计方法、决策准则如最大最小准则和期望值准则,以及贝叶斯决策中的风险函数和充分统计量。此外,文章还讨论了多目标决策的挑战,如目标间的不可公度性和矛盾性,提出了加权法、目标规划法等解决策略。
摘要由CSDN通过智能技术生成

一、绪论

1. 决策就是依据客观条件在有限时间内作出符合主观要求的决定

2. 决策的考虑因素:承担风险的规模和影响时间,计划的灵活程度,对人的影响

3. 决策考虑的方面:从一个目标出发,一组备选方案,可能的后果及对应概率,方案评估

 

 

 

二、效用

1. 效用定义及假设

效用:效用是在有风险的情况下决策人对后果的偏好的量化

假定:任何两个可能的后果均可比较;任何不确定的后果均存在等价的确定性后果;C的引入并不改变对A、B的看法

       展望:选择某一行动后的所有可能后果及其概率P=(p1, C1; p2, C2; ……; pn, Cn)

2. 效用函数估计方法

       ①使用确定当量进行估计,找出两个典型后果C1、C2(最好&最坏)作为基准,对于C1 ≺Ci≺C2,找出Ci~(p1, C1; 1-p, C2),则有u(Ci)=p1u(C1)+(1-p)u(C2),令u(C1)=1,u(C2)=0

       ②检验效用的一致性:计算出多个Ci的效用后,可在Ci间再构建等价关系,如C4~(p, C3; 1-p, C5),可计算u’(C4),与u(C4)进行比较,差距较大时需要修正

       ③效用函数类型判断:函数两端假设为X1、X2,0.5[u(X1)+u(X2)]和u(0.5X1+0.5X2),前者大时为冒险型,否则保守型

 

三、决策准则

1. 最大最小准则(悲观)

       假设决策者有m个方案,n个状态,选择行动di时可能后果为Ci1,Ci2,…,Cin,则取所有可能的后果中收益最小的记为Ci0,之后在所有Ci0中选择收益最大的C0,即C0=maximinjCij

       例如:

2. 最小最大准则

       定义后悔值ρij=maxkCkj-Cij  ,每个值与同状态下最好的方案比较计算后悔值,每个方案选最大的后悔值,再选最大后悔值中的最小一个方案,即ρ0=minimaxjρij

       ※增加新的方案可能使原有方案的判断反转

       例如:

3. 最大最大准则(绝对乐观准则)

       C0=maximaxjCij

4. 期望值准则(知道概率分布的条件下)

       对每个方案计算期望收益Ai=j=1npiCij ,然后取期望最大的方案

5. 期望机会损失准则(与期望值准则对偶,结论相同)

       期望机会损失Li=j=1npiρij ,选期望机会损失最小的行动方案

6. 拉普拉斯准则

       信息不完全时,假设各状态概率均匀分布,再选择期望最大的方案

7. 均值-方差准则

       计算不同方案的期望与方差,J=αEX-(1-α)VX  ,根据决策者自身情况确定α。

8. 目标驱动准则

决策者设定目标收益τ,使收益尽可能接近目标,同时考虑决策者的风险厌恶/风险追逐程度。如下图中k>0时表示风险厌恶,选择使J最小的Q

四、决策树和影响图

1. 决策树

      

分析步骤

①画决策树,将发展的可能性表示出来

②预计可能的事件发生的概率(历史资料、专家估计、试验等)

③估计结果结点的盈亏值ui

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值