机器学习笔记2 - 朴素贝叶斯法

最新推荐文章于 2022-01-25 11:01:33 发布

淡淡的生活

最新推荐文章于 2022-01-25 11:01:33 发布

阅读量1.8k

点赞数

分类专栏： machine learning 文章标签：机器学习

machine learning 专栏收录该内容

45 篇文章 0 订阅

订阅专栏

1 概念

朴素贝叶斯法(Naive Bayes)是另一个简单直观的分类算法。顾名思义，它的核心是贝叶斯公式。
我们先看看最基本的贝叶斯公式：

P (y | x) = P ( x | y ) ( y ) P ( x ), (1)

对应到分类问题，

x 是特征向量，

y 是分类结果。

P(y|x) 的直观含义就是在给定特征

x 的情况下，实例的类别是

y 的概率。
接下来的事情就是要计算

P(x|y) 、

P(y) 和

P(x) 。

P (x | y) = = = P (X = x | Y = y) P (X (1) = x (1), X (2) = x (2), . . ., X (n) = x (n) | Y = C k) \prod j = 1 n P (X (l) = x (l) | Y = C k), (2)

P (y) = P (Y = C k), (3)

P(x) 可以用全概率公式展开，然后假设各个特征独立，计算联合概率得到：

P (x) = = = P (X = x) P (X (1) = x (1), X (2) = x (2), . ., X (n) = x (n)) \sum k P (Y = C k) \prod j = 1 n P (X (j) = x (j) | Y = C k), (4)

将(2)(3)(4)代入(1)得到：

P (Y = C k | X = x) = P ( Y = C k ) \prod n j = 1 P ( X ( j ) = x ( j ) | Y = C k ) \sum k P ( Y = C k ) \prod n j = 1 P ( X ( j ) = x ( j ) | Y = C k ), (5)

上面公式中，在一次分类任务中，对于所有地

Y=Ck 都是一样地，所以朴素贝叶斯分类器可以简化表示成：

y = f (x) = a r g m a x (P (Y = C k) \prod j = 1 n P (X (j) = x (j) | Y = C k)), (6)

接下来，需要计算得到

P(Y=Ck) 和

∏nj=1P(X(j)=x(j)|Y=Ck) 。这2个需要用参数估计的方法得到。我就把极大似然估计复习了一下。但是遇到了疑惑，使用极大似然估计需要知道样本的分布函数。但在实际应用中，怎么提前知道呢？后来一想，只要保证了标注样本的数量和质量，样本的分布就可以近似表示实际的分布了。那么

P(Y=Ck) 只需要统计它在样本中的概率即可。

2 已有工具

2.1 R: e1071

e1071提供朴素贝叶斯分类器。用法举例：¹

## Categorical data only:
data(HouseVotes84, package = "mlbench")
model <- naiveBayes(Class ~ ., data = HouseVotes84)
predict(model, HouseVotes84[1:10,])
predict(model, HouseVotes84[1:10,], type = "raw")

pred <- predict(model, HouseVotes84)
table(pred, HouseVotes84$Class)

## using laplace smoothing:
model <- naiveBayes(Class ~ ., data = HouseVotes84, laplace = 3)
pred <- predict(model, HouseVotes84[,-1])
table(pred, HouseVotes84$Class)


## Example of using a contingency table:
data(Titanic)
m <- naiveBayes(Survived ~ ., data = Titanic)
m
predict(m, as.data.frame(Titanic))

## Example with metric predictors:
data(iris)
m <- naiveBayes(Species ~ ., data = iris)
## alternatively:
m <- naiveBayes(iris[,-5], iris[,5])
m
table(predict(m, iris), iris[,5])