人工智能决策网络细谈

对决策网络一点小小的理解:
感觉有点像高中时期算数学期望的问题。在这种特殊的贝叶斯网络当中,存在一个需要决策的节点,比如对一辆车是买还是不买,对一天要出门是需要带伞还是不要带伞。还存在一个节点,表示最后的收益,可以用u来表示。比如买一辆二手车在不同情况下是赚了还是赔了,带伞对心情的影响等。但是只有这两个节点肯定不够,还需要有一个性质节点,比如这辆二手车的质量如何,质量好的概率是多少,质量差的概率是多少;天气好的概率是多少,天气差的概率是多少。有时候,还会有一个观察性质如何的节点,比如对二手车进行测试,比如天气预报等。

决策网络图示

节点

决策节点

如刚才例子中的带伞还是不带伞,买车还是不买车。决策节点被画成矩形

不确定性节点

比如上面例子中的天气好坏,车的质量等都属于不确定性节点。不确定性节点被画成椭圆形。

确定性节点

结果在某些情况下是确定性已知的。确定性节点被画成双椭圆形。

值节点

比如上面的心情数值节点和买车的赚赔情况节点。用菱形或八边形表示。

都用直线实线箭头表示
按照结束的节点类型分为功能弧,条件弧,信息弧。对做题不重要

例一 下雨带伞问题

不含观察节点的情况

带不带雨伞在这个问题中是决策节点,用矩形框表示。
天气好坏是不确定性节点,用椭圆表示。
U表示心情,是通过天气和是否带伞共同决定的,属于值节点,用菱形表示。
在这里插入图片描述
对此有天气的先验概率P(W=sun)=0.7,P(W=rain)=0.3。因此可以分别算出带雨伞和不带雨伞的期望,分别是35和70.所以选择不带雨伞,即最优选择得到的最优期望为MEU()=70

加入对天气的观测节点forecast

先假设forecast已知

此时forecast实际上是确定性节点,因此天气的情况受到预测的影响发生了变化
在这里插入图片描述
此时再分别计算带伞和不带伞的期望,发现带伞的期望值更高。
因此MEU(F=bad)=53

如果此时forecast不确定

则forecast为不确定节点,用椭圆表示
在这里插入图片描述
此时分别求出来在预测结果是good时带伞和不带伞的期望以及预测结果是bad时带伞和不带伞的期望,分别获得MEU(),MEU(F=bad)和MEU(F=good)

信息价值

此时就可以引入信息价值的概念。
如果P(F=good)=0.59,P(F=bad)=0.41,分别用对应的MEU×F的概率再相加,就可以得到在有F这个观察值的情况下的期望是多少。用这个期望值减去没有F观察下的期望值,就可以获得F观察的信息的价值是多大。
如果付出这个了一个价值获得了这个信息,通过这种方式就可以计算出获得信息的价值。如果这条信息的价值大于付出的代价,就认为付出是值得的,否则就认为付出是不值得的。由此可以判断需不需要用这个代价获得这条信息。

ps:其实就是看看这条信息值不值付出的代价。

例:买卖二手车问题

在这里插入图片描述

1.

如果不做测试,那么决策网络中就没有测试节点。用Buy表示是否购买车,用Quality表示车的质量,用u表示获得的期望。因此决策网络如下图。
在这里插入图片描述
易得EU(Buy=false)=0,EU(Buy=true)=0.7×5000+0.3×(-2000)=3500-600=2900
因此不做测试的情况下买车C所期望得到的净利润为2900元

2.

给定P(T=pass|Q=+q)=0.9,P(T=pass|Q=-q)=0.2,又知道P(+q)=0.7,P(-q)=0.3
根据贝叶斯公式,易得P(T=pass)=0.69,P(T=refuse)=0.31,P(+q|T=pass)=0.91,P(+q|T=refuse)=0.23
由此得到新的决策网络如图
在这里插入图片描述
欲求概率如图。

3.

首先求出T=pass时买车和不买车的期望。
EU(Buy=true|Test=pass)=0.91×5000+0.09×(-2000)=4370
EU(Buy=false|Test=pass)=0
因此MEU(Test=pass)=4370
EU(Buy=true|Test=refuse)=0.23×5000+0.77×(-2000)=-390
EU(Buy=false|Test=refuse)=0
因此MEU(Test=refuse)=0
因此如果测试通过,就购买车C,期望获得4390元收益;如果测试不通过,就不购买车C,期望收益为0元。

4.

由1得MEU()=2900
因此VPI(Test)=4370×0.69+0×0.31-2900=115.3<300
因此不应该做测试

  • 10
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SZn..

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值