人工智能决策网络

人工智能决策网络

杂谈:就是在概率的基础上加了权值,求一个数学期望。计算的时候,有些地方可以剥离开来,先将U的父节点那里算清楚,再结合操作,计算最终的数学期望。

一,下雨带伞一例

1.父节点非常简单,只有先验概率

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Q1TdlB1U-1603355338602)(人工智能决策网络.assets/image-20201022151223882.png)]

2.父节点稍微复杂,有一个影响他的子节点(但是子节点是常量),条件概率

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2PmF9AcQ-1603355338608)(人工智能决策网络.assets/image-20201022151450374.png)]

3.进一步升级,子节点是随机变量。(引入了一个信息价值的概念)

在这里插入图片描述

二,二手车一例

题目:

一辆车的车况可能有好(Q=+q),有坏(Q=-q),所以二手车收购员购买车前需要进行不同的测试(测试可能需要花费一定的费用),然后依据不同的测试结果决定是否购买。假设一个收购员买车的时候时间只够进行一项测试(需花费300员),这项测试能够帮助他弄清楚车的近况。测试结果可能是T:通过(T=pass)或没通过(T=fail)。一辆车c的价值是一万5千元。而如果车况好,市场价格是2万元,如果车况不好,需要花费7千元修理费把车调整到好的车况。据估计,c车车况好的概率是70%。

1.如果不做测试,买车c所期望得到的净收入是多少?

杂谈:做这类题先要画出决策网络,Q,T之间弧的方向可以随便。

首先根据收益,找到决定它的父节点,Action(Buy),Effect(直接影响,这里是Quality,车况)。画出收益表。

其次,Q的先验概率已经给出,可以画在旁边。有了这些信息第一题就可以做了。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HSpZlJrX-1603355338613)(人工智能决策网络.assets/image-20201022151831575.png)]

2.假设测试结果的概率分布如下:

P(T=pass|Q=+q)=0.9

P(T=pass|Q=-q)=0.2

计算车辆通过/不通过检测的概率,以及测试后车况好坏的概率

杂谈:其实测试,明显要作为一个Evidence,但是题干没有直接给出。所以需要我们计算。这里,只看Q->T,Q已知,T在Q的条件概率也已知,可以计算出P(T)的分布列。其次第二小问,问的是测试后的车况,明显是一个条件概率,P(Q|T),应用公式计算即可。

有一个小技巧就是“算一半”,因为这里随机变量取值是布尔型,另一半可以直接用一减。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4rgAh58c-1603355338625)(人工智能决策网络.assets/image-20201022161426987.png)]

3.计算测试后的最优方案,以及期望收益

杂谈:测试后的最优方案,由于测试后的结果有两个pass,fail所以这里应该计算MEU(T=pass),MEU(T=fail)。

可以得出结论:如果测试通过,最优方案是买,期望收益是4370;

测试不通过,最优方案是不买,期望收益是0;

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NHvmnDyT-1603355338628)(人工智能决策网络.assets/image-20201022162039058.png)]

4.计算VPI,并决定是不是应该做测试。

杂谈:VPI的性质上课讲过很多,但是这里只需要明确,信息的价值=有它的收益-没它的收益。

这里的信息指的是测试的结果,由于是随机变量T,所以要加权。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-W07DxTnJ-1603355338630)(人工智能决策网络.assets/image-20201022162313004.png)]

  • 13
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值