信念状态和应急措施处理不确定性仍有缺陷,模型庞大复杂。有时没有可以保证达到Agent的目标的规划,然而Agent仍需要有所行动。
逻辑Agent相信每个语句是正确的或错误的或不做评价;
概率Agent为每条语句赋予一个0到1之间的数值作为其信念度,从而解决限制问题。
Agent首先必须在各种规划的不同结果之间有所偏好。Agent会偏好那些效用更高的状态。
Ω样本空间,ω表示其中的一个样本,样本空间中的可能世界的总概率是1
概率:
P(Total=11)这样的概率为无条件概率或先验概率;是指不知道其他信息的情况下对命题的信念度
P(doubles|Die1=5)这样的概率称为条件概率或后验概率
概率推理
边缘化/求和消元:
独立性(边缘独立性或绝对独立性)
P(X∣Y)=P(X)
P(Y∣X)=P(Y)
P(X∧Y)=P(X)P(Y)
条件独立性
P(X,Y∣Z)=P(X∣Z)P(Y∣Z)
等价于
P ( X ∣ Y , Z ) = P ( X ∣ Z ) P ( Y ∣ X , Z ) = P ( Y ∣ Z ) P(X | Y, Z) = P(X | Z)
P(Y | X, Z)= P(Y | Z)
P(X∣Y,Z)=P(X∣Z)
P(Y∣X,Z)=P(Y∣Z)
贝叶斯规则
总结:通常单一原因直接影响许多结果,这些结果在给定此原因时都是彼此条件独立.这时完全联合分布可写为:
这样的一个概率分布被称为一个朴素贝叶斯模型。