根据以下微博账号数据集,训练朴素贝叶斯分类器,并决策:拥有特征{L=l,F=s,H=yes}的微博账号是否是真实账号。
P(R=yes)=7/10
P(L=l|R=yes)=3/7 P(F=s|R=yes)=1/7 P(H=yes|R=yes)=5/7
P(R=no)=3/10
P(L=l|R=no)=0 P(F=s|R=no)=1 P(H=yes|R=no)=1/3
P(R=yes)*P(L=l|R=yes)*P(F=s|R=yes)*P(H=yes|R=yes)=3/98
P(R=no)*P(L=l|R=no)*P(F=s|R=no)*P(H=yes|R=no)=0
P(R=yes)*P(L=l|R=yes)*P(F=s|R=yes)*P(H=yes|R=yes)更大
即拥有特征{L=l,F=s,H=yes}的微博账号是真实账号
按照 λ=3 进行平滑估计概率
P(R=yes)10/16
P(L=l|R=yes)=6/16 P(F=s|R=yes) 4/16 P(H=yes|R=yes)=8/13
P(R=no)=6/16
P(L=l|R=no)=3/12 P(F=s|R=no)=6/12 P(H=yes|R=no)=4/9
P(R=yes)*P(L=l|R=yes)*P(F=s|R=yes)*P(H=yes|R=yes)=10/16*6/16*4/16*8/13=15/416
P(R=no)*P(L=l|R=no)*P(F=s|R=no)*P(H=yes|R=no)=6/16*3/12*6/12*4/9=1/48
P(R=yes)*P(L=l|R=yes)*P(F=s|R=yes)*P(H=yes|R=yes)更大
即拥有特征{L=l,F=s,H=yes}的微博账号是真实账号