简介
朴素贝叶斯分类器是基于贝叶斯公式的概率分类器,是建立在独立性假设基础上的。
贝叶斯公式可以把求解后验概率的问题转化为求解先验概率的问题,一般情况下后验概率问题 难以求解。例如;一封邮件是垃圾邮件的概率。通过贝叶斯公式可以把这个难解的问题转化为;计算垃圾邮件们各种特征出现的概率以及垃圾邮件出现的概率。因此朴素贝叶斯可以通过对已经掌握的“经验”(数据)的学习来预测一个很有价值的分类结果。
引入独立性假设
分类器最终的输出;选择最大概率的分类作为预测结果。
Python实现
导入所需包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.naive_bayes import BernoulliNB # 伯努利
from sklearn.naive_bayes import MultinomialNB # 多项式
from sklearn.naive_bayes import GaussianNB # 高斯朴素贝叶斯
from sklearn.datasets import load_digits # datasets 数据集, load_digits 手写数字数据集
from sklearn.model_selection import train_test_split # 切分训练集和测试集
导入数据
digits=load_digits()
数据探索
digits.data
digits.data.shape
print(digits.DESCR)
digits.target_names #标签
可以看出digits数据集是一些手写数字的8×8像素图片(矩阵),标签列取值为0到9
查看各标签比例
digits.target_names
b=