1.算法思想——基于概率的预测
贝叶斯决策论是概率框架下实施决策的基本方法。对分类任务来说,在所有相关概率都已知的情况下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的标记类别。
2. 理论基础
2.1 贝叶斯定理
这个定理解决了现实生活中经常遇到的问题:已知某条件概率,如何得到两个时间交换后的概率,也就是已知P(B∣A) 的情况下如何求得P(B∣A)
条件概率P(B∣A):事件B已经发生的情况下,事件A发生的概率。
基本求解公式为:P(A∣B) =
贝叶斯定理之所以有用,是因为在我们生活中经常遇到这种情况:我们很容易得到P(A∣B) P(A|B)P(A∣B),P(B∣A) P(B|A)P(B∣A)则很难直接得出,但我们更关心P(B∣A) ,贝叶斯定理则为我们打通从P(A∣B)获得P(B∣A)的道路。
贝叶斯定理: P(B∣A) =
先验概率:是指根据以往经验和分析得到的概率.
后验概率:事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小
实现代码:
import math
import random
cla_all_num = 0
cla_num = {}
cla_tag_num = {}
landa = 0.6# 拉普拉斯修正值
def train(taglist, cla):