7.1试使用极大似然法估算西瓜数据集3.0中前3个属性的类条件概率。
极大似然就是进行概率假设,然后对假设的概率分布参数进行估计
假设第一个属性色泽概率分布为:
P(色泽=青绿|好瓜)= ξ 1 \xi_1 ξ1
P(色泽=乌黑|好瓜)= ξ 2 \xi_2 ξ2
P(色泽=浅白|好瓜)= ξ 3 = 1 − ξ 1 − ξ 2 \xi_3=1-\xi_1-\xi_2 ξ3=1−ξ1−ξ2
似然函数:
L ( ξ ) = ∏ i P ( 色 泽 = x i ∣ 好 瓜 ) = ξ 1 3 ξ 2 4 ( 1 − ξ 1 − ξ 2 ) L(\xi)=\prod_i P(色泽=x_i|好瓜)=\xi_1^3\xi_2^4(1-\xi_1-\xi_2) L(ξ)=∏iP(色泽=xi∣好瓜)=ξ13ξ24(1−ξ1−ξ2)
L ( ξ 1 ) ′ = ξ 1 2 ξ 2 4 ( 3 − 4 ξ 1 − 3 ξ 2 ) {L(\xi_1)}'=\xi_1^2\xi_2^4(3-4\xi_1-3\xi_2) L(ξ1)′=ξ12ξ24(3−4ξ1−3ξ2)
L ( ξ 2 ) ′ = ξ 1 3 ξ 2 3 ( 4 − 4 ξ 1 − 5 ξ 2 ) {L(\xi_2)}'=\xi_1^3\xi_2^3(4-4\xi_1-5\xi_2) L(ξ2)′=ξ13ξ23(4−4ξ1−5ξ2)
L ( ξ 1 ) ′ = L ( ξ 2 ) ′ = 0 {L(\xi_1)}'={L(\xi_2)}'=0 L(ξ1)′=L(ξ2)′=0
ξ 1 = 3 8 \xi_1=\frac{3}{8} ξ1