对决策网络一点小小的理解:
感觉有点像高中时期算数学期望的问题。在这种特殊的贝叶斯网络当中,存在一个需要决策的节点,比如对一辆车是买还是不买,对一天要出门是需要带伞还是不要带伞。还存在一个节点,表示最后的收益,可以用u来表示。比如买一辆二手车在不同情况下是赚了还是赔了,带伞对心情的影响等。但是只有这两个节点肯定不够,还需要有一个性质节点,比如这辆二手车的质量如何,质量好的概率是多少,质量差的概率是多少;天气好的概率是多少,天气差的概率是多少。有时候,还会有一个观察性质如何的节点,比如对二手车进行测试,比如天气预报等。
决策网络图示
节点
决策节点
如刚才例子中的带伞还是不带伞,买车还是不买车。决策节点被画成矩形。
不确定性节点
比如上面例子中的天气好坏,车的质量等都属于不确定性节点。不确定性节点被画成椭圆形。
确定性节点
结果在某些情况下是确定性已知的。确定性节点被画成双椭圆形。
值节点
比如上面的心情数值节点和买车的赚赔情况节点。用菱形或八边形表示。
弧
都用直线实线箭头表示
按照结束的节点类型分为功能弧,条件弧,信息弧。对做题不重要
例一 下雨带伞问题
不含观察节点的情况
带不带雨伞在这个问题中是决策节点,用矩形框表示。
天气好坏是不确定性节点,用椭圆表示。
U表示心情,是通过天气和是否带伞共同决定的,属于值节点,用菱形表示。
对此有天气的先验概率P(W=sun)=0.7,P(W=rain)=0.3。因此可以分别算出带雨伞和不带雨伞的期望,分别是35和70.所以选择不带雨伞,即最优选择得到的最优期望为MEU()=70
加入对天气的观测节点forecast
先假设forecast已知
此时forecast实际上是确定性节点,因此天气的情况受到预测的影响发生了变化
此时再分别计算带伞和不带伞的期望,发现带伞的期望值更高。
因此MEU(F=bad)=53
如果此时forecast不确定
则forecast为不确定节点,用椭圆表示
此时分别求出来在预测结果是good时带伞和不带伞的期望以及预测结果是bad时带伞和不带伞的期望,分别获得MEU(),MEU(F=bad)和MEU(F=good)
信息价值
此时就可以引入信息价值的概念。
如果P(F=good)=0.59,P(F=bad)=0.41,分别用对应的MEU×F的概率再相加,就可以得到在有F这个观察值的情况下的期望是多少。用这个期望值减去没有F观察下的期望值,就可以获得F观察的信息的价值是多大。
如果付出这个了一个价值获得了这个信息,通过这种方式就可以计算出获得信息的价值。如果这条信息的价值大于付出的代价,就认为付出是值得的,否则就认为付出是不值得的。由此可以判断需不需要用这个代价获得这条信息。
ps:其实就是看看这条信息值不值付出的代价。
例:买卖二手车问题
1.
如果不做测试,那么决策网络中就没有测试节点。用Buy表示是否购买车,用Quality表示车的质量,用u表示获得的期望。因此决策网络如下图。
易得EU(Buy=false)=0,EU(Buy=true)=0.7×5000+0.3×(-2000)=3500-600=2900
因此不做测试的情况下买车C所期望得到的净利润为2900元
2.
给定P(T=pass|Q=+q)=0.9,P(T=pass|Q=-q)=0.2,又知道P(+q)=0.7,P(-q)=0.3
根据贝叶斯公式,易得P(T=pass)=0.69,P(T=refuse)=0.31,P(+q|T=pass)=0.91,P(+q|T=refuse)=0.23
由此得到新的决策网络如图
欲求概率如图。
3.
首先求出T=pass时买车和不买车的期望。
EU(Buy=true|Test=pass)=0.91×5000+0.09×(-2000)=4370
EU(Buy=false|Test=pass)=0
因此MEU(Test=pass)=4370
EU(Buy=true|Test=refuse)=0.23×5000+0.77×(-2000)=-390
EU(Buy=false|Test=refuse)=0
因此MEU(Test=refuse)=0
因此如果测试通过,就购买车C,期望获得4390元收益;如果测试不通过,就不购买车C,期望收益为0元。
4.
由1得MEU()=2900
因此VPI(Test)=4370×0.69+0×0.31-2900=115.3<300
因此不应该做测试