《Web安全之机器学习入门》笔记：第七章 7.2朴素贝叶斯hello world

最新推荐文章于 2024-10-18 13:06:27 发布

mooyuan天天

最新推荐文章于 2024-10-18 13:06:27 发布

阅读量145

点赞数

分类专栏： Web安全之机器学习入门文章标签： web安全机器学习安全朴素贝叶斯算法

本文链接：https://blog.csdn.net/mooyuan/article/details/122758282

版权

Web安全之机器学习入门专栏收录该内容

57 篇文章 36 订阅

订阅专栏

原书github配的源码并不包含本小结的内容，完整基于python3的代码如下所示：

from sklearn import datasets
from sklearn.naive_bayes import GaussianNB

# 导入数据集
iris = datasets.load_iris()
# 训练数据集
gnb = GaussianNB()
# 验证结果
y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)
print(iris.target)
print(y_pred)
print("Number of mislabeled points out of a total %d points : %d" % (iris.data.shape[0], (iris.target != y_pred).sum()))

运行结果如下

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1
 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 1 2 2 2 2
 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
Number of mislabeled points out of a total 150 points : 6

这一小节主要内容是用鸢尾花数据集来作为实验数据集讲解朴素贝叶斯的基本用法。