朴素贝叶斯示例
一. 数据
ID | 色泽 | 根蒂 | 敲声 | 纹理 | 脐部 | 触感 | 密度 | 含糖率 | 好瓜 |
---|---|---|---|---|---|---|---|---|---|
1 | 青绿 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.697 | 0.460 | 是 |
2 | 乌黑 | 蜷缩 | 沉闷 | 清晰 | 凹陷 | 硬滑 | 0.774 | 0.376 | 是 |
3 | 乌黑 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.634 | 0.264 | 是 |
4 | 青绿 | 蜷缩 | 沉闷 | 清晰 | 凹陷 | 硬滑 | 0.608 | 0.318 | 是 |
5 | 浅白 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.556 | 0.215 | 是 |
6 | 青绿 | 稍蜷 | 浊响 | 清晰 | 稍凹 | 软粘 | 0.403 | 0.237 | 是 |
7 | 乌黑 | 稍蜷 | 浊响 | 稍糊 | 稍凹 | 软粘 | 0.481 | 0.149 | 是 |
8 | 乌黑 | 稍蜷 | 浊响 | 清晰 | 稍凹 | 硬滑 | 0.437 | 0.211 | 是 |
9 | 乌黑 | 稍蜷 | 沉闷 | 稍糊 | 稍凹 | 硬滑 | 0.666 | 0.091 | 否 |
10 | 青绿 | 硬挺 | 清脆 | 清晰 | 平坦 | 软粘 | 0.243 | 0.267 | 否 |
11 | 浅白 | 硬挺 | 清脆 | 模糊 | 平坦 | 硬滑 | 0.245 | 0.057 | 否 |
12 | 浅白 | 蜷缩 | 浊响 | 模糊 | 平坦 | 软粘 | 0.343 | 0.099 | 否 |
13 | 青绿 | 稍蜷 | 浊响 | 稍糊 | 凹陷 | 硬滑 | 0.639 | 0.161 | 否 |
14 | 浅白 | 稍蜷 | 沉闷 | 稍糊 | 凹陷 | 硬滑 | 0.657 | 0.198 | 否 |
15 | 乌黑 | 稍蜷 | 浊响 | 清晰 | 稍凹 | 软粘 | 0.360 | 0.370 | 否 |
16 | 浅白 | 蜷缩 | 浊响 | 模糊 | 平坦 | 硬滑 | 0.593 | 0.042 | 否 |
17 | 青绿 | 蜷缩 | 沉闷 | 稍糊 | 稍凹 | 硬滑 | 0.719 | 0.103 | 否 |
测试 | 青绿 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.697 | 0.460 | ? |
二. 计算
2.1 计算标签(好瓜)的先验概率:
P ( 好瓜 = 是 ) = 8 17 ≈ 0.471 P ( 好瓜 = 否 ) = 9 17 ≈ 0.529 \begin{aligned} P(好瓜=是) = \frac{8}{17} \approx 0.471 \\ P(好瓜=否) = \frac{9}{17} \approx 0.529 \end{aligned} P(好瓜=是)=178≈0.471P(好瓜=否)=179≈0.529
2.2 计算属性的条件概率
2.2.1 离散变量
离散属性 | 好瓜 = 是(8个样本) | 好瓜 = 否(9个样本) |
---|---|---|
青绿 | 3 | 3 |
蜷缩 | 5 | 3 |
浊响 | 6 | 4 |
清晰 | 7 | 2 |
凹陷 | 5 | 2 |
硬滑 | 6 | 6 |
P ( 青绿 ∣ 是 ) = P ( 色泽 = 青绿 ∣ 好瓜 = 是 ) = 3 8 = 0.375 P ( 青绿 ∣ 否 ) = P ( 色泽 = 青绿 ∣ 好瓜 = 否 ) = 3 9 ≈ 0.333 P ( 蜷缩 ∣ 是 ) = P ( 根蒂 = 蜷缩 ∣ 好瓜 = 是 ) = 5 8 = 0.625 P ( 蜷缩 ∣ 否 ) = P ( 根蒂 = 蜷缩 ∣ 好瓜 = 否 ) = 3 9 ≈ 0.333 P ( 浊响 ∣ 是 ) = P ( 敲声 = 浊响 ∣ 好瓜 = 是 ) = 6 8 = 0.750 P ( 浊响 ∣ 否 ) = P ( 敲声 = 浊响 ∣ 好瓜 = 否 ) = 4 9 ≈ 0.444 P ( 清晰 ∣ 是 ) = P ( 纹理 = 清晰 ∣ 好瓜 = 是 ) = 7 8 = 0.975 P ( 清晰 ∣ 否 ) = P ( 纹理 = 清晰 ∣ 好瓜 = 否 ) = 2 9 ≈ 0.222 P ( 凹陷 ∣ 是 ) = P ( 脐部 = 凹陷 ∣ 好瓜 = 是 ) = 5 8 = 0.625 P ( 凹陷 ∣ 否 ) = P ( 脐部 = 凹陷 ∣ 好瓜 = 否 ) = 2 9 ≈ 0.222 P ( 硬滑 ∣ 是 ) = P ( 触感 = 硬滑 ∣ 好瓜 = 是 ) = 6 8 = 0.750 P ( 硬滑 ∣ 否 ) = P ( 触感 = 硬滑 ∣ 好瓜 = 否 ) = 6 9 ≈ 0.667 \begin{aligned} P{(青绿 \\| 是)} = P{(色泽 = 青绿 \\| 好瓜 = 是)} = \frac{3}{8} = 0.375 \\ P{(青绿 \\| 否)} = P{(色泽 = 青绿 \\| 好瓜 = 否)} = \frac{3}{9} \approx 0.333 \\ \\ P{(蜷缩 \\| 是)} = P{(根蒂 = 蜷缩 \\| 好瓜 = 是)} = \frac{5}{8} = 0.625 \\ P{(蜷缩 \\| 否)} = P{(根蒂 = 蜷缩 \\| 好瓜 = 否)} = \frac{3}{9} \approx 0.333 \\ \\ P{(浊响 \\| 是)} = P{(敲声 = 浊响 \\| 好瓜 = 是)} = \frac{6}{8} = 0.750 \\ P{(浊响 \\| 否)} = P{(敲声 = 浊响 \\| 好瓜 = 否)} = \frac{4}{9} \approx 0.444 \\ \\ P{(清晰 \\| 是)} = P{(纹理 = 清晰 \\| 好瓜 = 是)} = \frac{7}{8} = 0.975 \\ P{(清晰 \\| 否)} = P{(纹理 = 清晰 \\| 好瓜 = 否)} = \frac{2}{9} \approx 0.222 \\ \\ P{(凹陷 \\| 是)} = P{(脐部 = 凹陷 \\| 好瓜 = 是)} = \frac{5}{8} = 0.625 \\ P{(凹陷 \\| 否)} = P{(脐部 = 凹陷 \\| 好瓜 = 否)} = \frac{2}{9} \approx 0.222 \\ \\ P{(硬滑 \\| 是)} = P{(触感 = 硬滑 \\| 好瓜 = 是)} = \frac{6}{8} = 0.750 \\ P{(硬滑 \\| 否)} = P{(触感 = 硬滑 \\| 好瓜 = 否)} = \frac{6}{9} \approx 0.667 \\ \end{aligned} P(青绿∣是)=P(色泽=青绿∣好瓜=是)=83=0.375P(青绿∣否)=P(色泽=青绿∣好瓜=否)=93≈0.333P(蜷缩∣是)=P(根蒂=蜷缩∣好瓜=是)=85=0.625P(蜷缩∣否)=P(根蒂=蜷缩∣好瓜=否)=93≈0.333