机器学习入门+实战初级（二）—— 朴素贝叶斯

最新推荐文章于 2024-07-15 17:08:02 发布

ChenKai_164

最新推荐文章于 2024-07-15 17:08:02 发布

阅读量255

点赞数

分类专栏： python机器学习文章标签：机器学习 python 人工智能概率论其他

本文链接：https://blog.csdn.net/ChenKai_164/article/details/105716996

版权

python机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

欢迎关注公众号K的笔记阅读博主更多优质学习内容
K的笔记公众号

前一篇内容：机器学习入门+实战初级（一）—— 线性回归

注：本文假定读者已有概率论基础

数据设定：我们首先假定我们已有的数据为： $\left(x_{1}^{(1)}, x_{2}^{(1)}, \ldots x_{n}^{(1)}, y_{1}\right),\left(x_{1}^{(2)}, x_{2}^{(2)}, \ldots x_{n}^{(2)}, y_{2}\right), \ldots\left(x_{1}^{(m)}, x_{2}^{(m)}, \ldots x_{n}^{(m)}, y_{m}\right)$
即我们有 $m$ 个样本，每个样本有 $n$ 个特征，特征输出有 $K$ 个标签，定义为 $C_{1}, C_{2}, \ldots, C_{K}$
贝叶斯定理： $A)=\frac{P(A | B) * P(B)}{P(A)}$
贝叶斯公式：
$\frac{P(A | B)}{P(A)}=P(B) * \frac{P(A | B)}{\sum_{i=1}^{n} P\left(B_{i}\right) * P\left(A | B_{i}\right)}$
即后验概率 = 先验概率 * 似然估计

朴素贝叶斯模型

我们容易得到一个结论：如果似然估计 $\frac{P(B | A)}{P(B)}>1$ ，那么表示A事件的发生提高了B事件发生的概率。相反的，如果似然估计 $\frac{P(B | A)}{P(B)}<1$ ，那么表示A事件的发生降低了B事件发生的概率。
我们预测的类别 $C_{\text {result}}$ 是使 $P\left(Y=C_{k} | X=X^{(t e s t)}\right)$ 最大的类别:
$\begin{aligned} C_{\text {result}} &=\underbrace{\operatorname{argmax}}_{C_{k}} P\left(Y=C_{k} | X=X^{(\text {test})}\right) \\ &=\underbrace{\operatorname{argmax}}_{C_{k}} P\left(X=X^{(\text {test})} | Y=C_{k}\right) P\left(Y=C_{k}\right) / P\left(X=X^{(\text {test})}\right) \end{aligned}$
分析上式可知分母 $P\left(X=X^{(t e s t)}\right)$ ) 是固定值，因此预测公式可以简化为：
$C_{r e s u l t}=\underbrace{\operatorname{argmax}}_{C_{k}} P\left(X=X^{(t e s t)} | Y=C_{k}\right) P\left(Y=C_{k}\right)$
接着我们利用朴素贝叶斯的独立性假设，就可以得到通常意义上的朴素贝叶斯推断公式:
$C_{\text {result}}=\underbrace{\operatorname{argmax}}_{C_{k}} P\left(Y=C_{k}\right) \prod_{j=1}^{n} P\left(X_{j}=X_{j}^{(t e s t)} | Y=C_{k}\right)$
在朴素贝叶斯算法中，我们需要估计 $P\left(Y=C_{k}\right)$ 和 $P\left(X_{j}=X_{j}^{(t e s t)} | Y=C_{k}\right)$ 。具体方法可以使用极大似然估计法：
先验概率 $P\left(Y=C_{k}\right)$ 的极大似然估计是:
$P\left(Y=C_{k}\right)=\frac{\sum_{i=1}^{N} I\left(y_{i}=C_{k}\right)}{N}, k=1,2, \ldots K$
其中 $I\left(y_{i}=C_{k}\right)=\left\{\begin{array}{ll} 1 & y_{i}=C_{k} \\ 0 & y_{i} \neq C_{k} \end{array}\right.$
第 j个特征 X (j) 可能的取值集合为 $\left(a_{j 1}, a_{j 2}, \ldots a_{j s}\right),$ 似然函数 $P\left(X^{(j)}=a_{j l} | Y=C_{k}\right)=\frac{\sum_{i=1}^{N} I\left(X^{(j)}=a_{j l}, y_{i}=C_{k}\right)}{I\left(y_{i}=C_{k}\right)}$
$\ldots N, l=1,2, \ldots S, k=1,2, \ldots K$
即 $C_{k}$ 标签中，第 $j$ 个特征 $X^{(j)}$ 中各种取值的次数在 $C_{k}$ 标签出现总次数中的占比。

朴素贝叶斯 Python 应用

朴素贝叶斯 sklearn 具体形式为：

class sklearn.naive_bayes.MultinomialNB(alpha=1.0, fit_prior=True, class_prior=None)

函数集合为：

Method	Explain
fit(self, X, y[, sample_weight])	Fit Naive Bayes classifier according to X, y
get_params(self[, deep])	Get parameters for this estimator.
partial_fit(self, X, y[, classes, sample_weight])	Incremental fit on a batch of samples.
predict(self, X)	Perform classification on an array of test vectors X.
predict_log_proba(self, X)	Return log-probability estimates for the test vector X.
predict_proba(self, X)	Return probability estimates for the test vector X.
score(self, X, y[, sample_weight])	Return the mean accuracy on the given test data and labels.
set_params(self, **params)	Set the parameters of this estimator.

官网样例：

>>> import numpy as np
>>> rng = np.random.RandomState(1)
>>> X = rng.randint(5, size=(6, 100))
>>> y = np.array([1, 2, 3, 4, 5, 6])
>>> from sklearn.naive_bayes import MultinomialNB
>>> clf = MultinomialNB()
>>> clf.fit(X, y)
MultinomialNB()
>>> print(clf.predict(X[2:3]))
[3]

ChenKai_164

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习入门+实战初级（二）—— 朴素贝叶斯

前一篇内容：机器学习入门+实战初级（一）—— 线性回归注：本文假定读者已有概率论基础数据设定：我们首先假定我们已有的数据为：(x1(1),x2(1),…xn(1),y1),(x1(2),x2(2),…xn(2),y2),…(x1(m),x2(m),…xn(m),ym)\left(x_{1}^{(1)}, x_{2}^{(1)}, \ldots x_{n}^{(1)}, y_{1}\righ...
复制链接

扫一扫