任务描述
本关任务:学习了解第十三章的内容并完成习题。
相关知识
为了完成本关任务,你需要掌握:1. 不确定性概述;2. 基本概率符号;3. 概率公理;4. 条件独立性;5. 贝叶斯规则。
不确定性概述
Agent 的环境可能是部分可观察的或者不确定的,也可能是部分可观察并且不确定的。
逻辑理论无法处理不确定性问题,因为:惰性、理论的无知、实践的无知。
本体约束相同:世界由成立或者不成立的事实组成。
认识约束不同:逻辑 Agent 相信每个语句是正确的或者错误的,概率 Agent 为每个语句赋予一个0~1之间的数值作为其信念度。
决策理论 = 概率理论 + 效用理论
决策理论的基本思想:一个 Agent 是理性的,当且仅当它选择能产生最高期望效用的行动,称为期望效用最大化。
基本概率符号
概率模型:为每一个可能世界附一个数值概率p(w)。
注意:样本空间中的所有可能世界的总概率是1
事件(event):样本空间中的可能世界集合。
概率公理
对于任何命题A,B:
0 ≤ P(A) ≤ 1
P(true) = 1 and P(false) = 0
P(A ∨ B) = P(A) + P(B) - P(A ∧ B)
条件独立性
使用链式规则和条件独立性来变换完全联合分布的公式:
应用条件独立性能够将完全联合分布的公式从指数级的项数降到接近线性级。
条件独立性是依赖于我们从环境中的知识得到。
贝叶斯规则
联合概率规则:
P(a∧b) = P(a | b) P(b) = P(b | a) P(a)
贝叶斯规则:
P(a | b) = P(b | a) P(a) / P(b)
例如:脑膜炎导致脖子僵硬P(s|m)=0.7,脑膜炎的概率p(m)=1/50000,脖子僵硬的概率P(s)=0.01。
P(m|s)=P(s|m)P(m)/P(s)=0.0014
开始你的任务吧,祝你成功!