《机器学习》贝叶斯定理的运用

Zeeland

于 2022-12-29 04:22:25 发布

阅读量547

点赞数

分类专栏：机器学习文章标签：人工智能 python

本文链接：https://blog.csdn.net/linZinan_/article/details/128475801

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Introduction

朴素贝叶斯是一种基于贝叶斯定理的分类算法。贝叶斯定理是指对于两个事件A和B，可以表示为 P(A|B)=P(B|A)P(A)/P(B)。朴素贝叶斯算法假设所有输入特征之间相互独立，这样可以将多个特征的贡献组合起来，并使用贝叶斯定理来进行决策。

Example

下面是一个使用朴素贝叶斯算法进行文本分类的例子，使用的数据集是 sklearn 库中的 20 类新闻组。首先，我们需要导入必要的库：

from sklearn.datasets import fetch_20newsgroups
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.naive_bayes import MultinomialNB

然后，我们可以使用 fetch_20newsgroups 函数加载数据集：

newsgroups_train = fetch_20newsgroups(subset='train')
newsgroups_test = fetch_20newsgroups(subset='test')

接下来，我们需要对文本数据进行处理，使用 CountVectorizer 将文本数据转换成词袋模型，然后使用 TfidfTransformer 计算 tf-idf 值：

count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(newsgroups_train.data)

tfidf_transformer = TfidfTransformer()
X_train_tfidf = tfidf_transformer.fit_transform(X_train_counts)

X_test_counts = count_vect.transform(newsgroups_test.data)
X_test_tfidf = tfidf_transformer.transform(X_test_counts)

最后，我们可以使用转换好的数据来训练朴素贝叶斯模型，并使用测试数据来评估模型的性能：

clf = MultinomialNB().fit(X_train_tfidf, newsgroups_train.target)
predicted = clf.predict(X_test_tfidf)

from sklearn import metrics
print(metrics.classification_report(newsgroups_test.target, predicted))
print(metrics.confusion_matrix(newsgroups_test.target, predicted))

输出的分类报告和混淆矩阵可以帮助我们评估模型的性能。整个例子的代码如下：

from sklearn.datasets import fetch_20newsgroups
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.naive_bayes import MultinomialNB

newsgroups_train = fetch_20newsgroups(subset='train')
newsgroups_test = fetch_20newsgroups(subset='test')

count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(newsgroups_train.data)

tfidf_transformer = TfidfTransformer()
X_train_tfidf = tfidf_transformer.fit_transform(X_train_counts)

X_test_counts = count_vect.transform(newsgroups_test.data)
X_test_tfidf = tfidf_transformer.transform(X_test_counts)

clf = MultinomialNB().fit(X_train_tfidf, newsgroups_train.target)
predicted = clf.predict(X_test_tfidf)

from sklearn import metrics
print(metrics.classification_report(newsgroups_test.target, predicted))
print(metrics.confusion_matrix(newsgroups_test.target, predicted))

在这个例子中，我们使用朴素贝叶斯算法对新闻文本进行分类。假设我们要对一篇新闻文本进行分类，那么我们需要计算出这篇新闻文本属于每个类别的概率，然后选择概率最大的类别作为这篇新闻的分类结果。

具体来说，我们使用贝叶斯定理来计算出属于每个类别的概率。假设我们有 K 个类别，第 i 个类别的概率记作 P(C_i)，新闻文本中单词 w 的概率记作 P(w|C_i)，那么我们可以使用贝叶斯定理来计算出属于第 i 个类别的概率 P(C_i|w)：

P(C_i|w) = P(w|C_i)P(C_i) / P(w)

我们可以使用训练数据来估计 P(C_i) 和 P(w|C_i) 的值，然后使用贝叶斯定理来计算出属于每个类别的概率。最后，我们只需要选择概率最大的类别作为新闻文本的分类结果。

在使用朴素贝叶斯算法进行分类时，我们使用贝叶斯定理来计算出属于每个类别的概率，具体来说，我们可以使用如下公式来计算出属于第 i 个类别的概率 P(C_i|w)：

P(C_i|w) = P(w|C_i)P(C_i) / P(w)

这里的 P(w|C_i) 表示新闻文本中出现的所有单词在第 i 个类别中的概率。P(C_i) 表示第 i 个类别的概率。这两个概率可以使用训练数据来估计。

P(w) 表示新闻文本中出现的所有单词的概率。这个概率可以通过将所有类别的概率相加得到，即 P(w) = ∑P(C_i|w)。

假设我们有两个类别，第一个类别是“科技”，第二个类别是“旅游”。我们要对一篇新闻文本进行分类，新闻文本中出现了单词“苹果”和“旅行”。我们希望计算出这篇新闻文本属于“科技”类别的概率和属于“旅游”类别的概率。

首先，我们需要计算出 P(C_1) 和 P(C_2)，即“科技”类别和“旅游”类别的概率。我们假设 P(C_1)=0.3，P(C_2)=0.7。

最后，我们可以使用贝叶斯定理来计算出属于“科技”类别的概率和属于“旅游”类别的概率。具体来说：

P(C_1|w) = P(苹果|C_1)P(旅行|C_1)P(C_1) / P(w)
= (0.4)(0.1)(0.3) / [(0.4)(0.1)(0.3) + (0.1)(0.4)(0.7)]
≈ 0.143

P(C_2|w) = P(苹果|C_2)P(旅行|C_2)P(C_2) / P(w)
= (0.1)(0.4)(0.7) / [(0.4)(0.1)(0.3) + (0.1)(0.4)(0.7)]
≈ 0.857

根据计算结果，这篇新闻文本属于“科技”类别的概率是 0.143，属于“旅游”类别的概率是 0.857，因此我们可以将这篇新闻文本分类为“旅游”。

Zeeland

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
《机器学习》贝叶斯定理的运用

朴素贝叶斯是一种基于贝叶斯定理的分类算法。贝叶斯定理是指对于两个事件A和B，可以表示为 P(A|B)=P(B|A)P(A)/P(B)。朴素贝叶斯算法假设所有输入特征之间相互独立，这样可以将多个特征的贡献组合起来，并使用贝叶斯定理来进行决策。
复制链接

扫一扫