读第七章 朴素贝叶斯分类器
得知一个瓜Q的参数后,在样本集中分析Q拥有的各属性在好与坏中出现的概率,并假设各概率间相互独立,最后综合得出好瓜的概率,为瓜Q的各参数值为好瓜的概率总乘积,坏瓜概率为瓜Q各参数值可能为坏瓜概率乘积。最后比较好瓜概率与坏瓜概率,得出瓜Q是好瓜还是坏瓜。
当瓜Q某属性值在样本群中全为坏,或不存在好的样本,则会导致该属性好瓜概率为0,为了避免这种状况,常用“拉普拉斯修正”,即在属性群中增加结果类,简单来讲就是判断结果为好坏两种,则N=2,若判断是生瓜/熟瓜/腐瓜,则N=3,增加属性值即防止分子为0,避免了样本群中某属性无好瓜的情况,这种方法虽然会改变样本概率,但不会影响最终结果的判断。