一、介绍
1. 朴素贝叶斯
朴素:指各特征之间相互独立
贝叶斯公式
2. 朴素贝叶斯算法
基于贝叶斯定理与特征条件独立假设的分类方法
特征条件独立性假设:假设单一样本的 n 个特征
彼此之间在各种意义上相互独立
【定义】输入:
(1)训练数据,其中
,
是第i个样本的第j个特征,
,
是第j个特征可能取的第l个值,
(2)实例x
输出:
实例x的分类
【分析】
求的x的分类即是求满足P(y|x)最大值的y
又,
是常数,所以可以简化为求
,又假设相互之间独立,所以可以简化为
【实现】
(1)计算Y先验概率
(2)计算条件概率
(3)计算(1)(2)两式的乘积,找到使得乘积最大的Y值
【面试题】假设一个房间有5个婴儿,性别2男3女,现在加入一个性别未知的婴儿。此时从这6个婴儿中,随机抽取一个,发现是男孩子。问后来加入婴儿性别是男孩子的概率多大?