引言
无人驾驶训练中,巡练汽车遇到不同的坡度和颠簸度时候,怎样控制车速快慢。在大量数据的形成的散点图中,寻找决策面,进行分类
1. 在anaconda环境中安装scikit-learn
1.1. 导入高斯NaiveBayes代码:
from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()
2.贝叶斯规则Bayes rule
2.1 条件概率、全概率、贝叶斯
条件概率
P(A|B)=P(AB)P(B),P(B|A)=P(AB)P(A)
概率乘法公式
P(AB)=P(A|B)P(B)
P(A1A2A3)=P(A1)P(A2|A1)P(A3|A1A2)全概率
P(A)=P(AB)+P(AB¯)=P(A|B)P(B)+P(AB¯)P(B¯)
叶斯公式
P(A|B)=P(AB)P(B)=P(B|A)P(A)P(B)=P(B|A)P(A)P(AB)+P(A¯B)
2.2 贝叶斯公式的解释
-
P(h|D)=P(D|h)P(h)P(D)
给定数据下假设成立的概率=
给定假设下出现数据的概率x假设的概率(先验概率)/数据的概率
2.4 贝叶斯网络
可以参考 从贝叶斯方法谈到贝叶斯网络
2.5 应用场合、优缺点
- 优点:算法简单、所需估计参数很少、对缺失数据不太敏感。另外朴素贝叶斯的计算过程类条件概率等计算彼此是独立的,因此特别适于分布式计算。朴素贝叶斯属于生成式模型,收敛速度将快于判别模型(如逻辑回归);天然可以处理多分类问题
- 缺点:因为朴素贝叶斯分类假设样本各个特征之间相互独立,这个假设在实际应用中往往是不成立的,从而影响分类正确性;不能学习特征间的相互作用;对输入数据的表达形式很敏感。
- 应用:常应用在文本分类。垃圾邮件过滤,医学上假阳性判断