python贝叶斯模型_【挖掘模型】： Python-朴素贝叶斯分类

最新推荐文章于 2023-04-06 17:52:05 发布

weixin_39723441

最新推荐文章于 2023-04-06 17:52:05 发布

阅读量82

点赞数

文章标签： python贝叶斯模型

Paste_Image.png

利用贝叶斯定理中概率统计知识，对离散型的数据进行分类的算法

# 优点算法易于实现和部署，执行效率和准确度高

# 缺点适合处理离散型的数据,不适合处理连续型的数据

# 贝叶斯定理 P(A|B)= P(A∩B)/P(B) = (P(B|A)*P(A))/P(B)

# 例子：

# 症状职业疾病

# 打喷嚏护士感冒

# 打喷嚏农夫过敏

# 头痛建筑工人脑震荡

# 头痛建筑工人感冒

# 打喷嚏教师感冒

# 头痛教师脑震荡

# 现在来了第七个病人，是一个打喷嚏的建筑工人，他患那种疾病的概率最高？

# P(感冒｜打喷嚏 * 建筑工人) = P(打喷嚏 * 建筑工人)*P(感冒)/P(打喷嚏 * 建筑工人)

# 假设打喷嚏和建筑工人是独立的

# P(感冒｜打喷嚏 * 建筑工人) = P (打喷嚏｜感冒)* P(建筑工人｜感冒) *P(感冒)/ P(打喷嚏)*P(建筑工人)

#　＝　0.66 * 0.33 * 0.5/0.33*0.5

# P(过敏｜打喷嚏 * 建筑工人) = 0

# P(脑震荡｜打喷嚏 * 建筑工人) = 0

import numpy;

import pandas;

data = pandas.read_csv("F:\\python 数据挖掘分析实战\\Data\\data (3).csv");

fData = data[

["ParentIncome", 'IQ', "Gender", "ParentEncouragement"]

].to_dict('records')

tData = data["CollegePlans"]

from sklearn.feature_extraction import DictVectorizer

dictVectorizer = DictVectorizer()

pData = dictVectorizer.fit_transform(

fData

).toarray()

pData = pData[:, [1, 2, 3, 5]]

#随机重排序

permutation = numpy.random.permutation(data.shape[0])

pData = pData[permutation]

tData = tData[permutation]

#高斯贝叶斯

from sklearn.naive_bayes import GaussianNB

GNBModel = GaussianNB()

GNBModel.fit(pData[:6000], tData[:6000])

GNBModel.score(pData[6000:], tData[6000:])

#多项朴素贝叶斯

from sklearn.naive_bayes import MultinomialNB

MNBModel = MultinomialNB()

MNBModel.fit(pData[:6000], tData[:6000])

MNBModel.score(pData[6000:], tData[6000:])

#伯努利贝叶斯

from sklearn.naive_bayes import BernoulliNB

BNBModel = BernoulliNB()

BNBModel.fit(pData[:6000], tData[:6000])

BNBModel.score(pData[6000:], tData[6000:])

参考文献

作者A：ken

weixin_39723441

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python贝叶斯模型_【挖掘模型】： Python-朴素贝叶斯分类

Paste_Image.png利用贝叶斯定理中概率统计知识，对离散型的数据进行分类的算法# 优点算法易于实现和部署，执行效率和准确度高# 缺点适合处理离散型的数据,不适合处理连续型的数据# 贝叶斯定理 P(A|B)= P(A∩B)/P(B) = (P(B|A)*P(A))/P(B)# 例子：# 症状职业疾病# 打喷嚏护士感冒# 打喷...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。