头歌实训平台--实用机器学习--朴素贝叶斯模型

最新推荐文章于 2024-10-18 13:14:49 发布

C爱吃可爱多

最新推荐文章于 2024-10-18 13:14:49 发布

阅读量2.7k

点赞数 6

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_56803218/article/details/133901163

版权

第1关：利用sklearn构建朴素贝叶斯模型

任务描述

本关任务：编写一个使用贝叶斯分类器完成垃圾邮件分类的程序。

相关知识

为了完成本关任务，你需要掌握：1.朴素贝叶斯模型，2.使用sklearn构建朴素贝叶斯分类器。

朴素贝叶斯模型

贝叶斯方法是一种生成式分类模型，这是一种从概率论上延伸出来的方法。在概率论与统计学中，贝叶斯定理表达了一个事件发生的概率，而确定这一概率的方法是基于与该事件相关的条件先验知识。而利用相应先验知识进行概率推断的过程为贝叶斯推断。

编程要求

根据提示，在右侧编辑器补充代码，完成使用sklearn构建朴素贝叶斯分类器，包括：

数据处理
训练测试集的划分
模型训练
测试数据预测和AUC计算
打印AUC

通关代码：

import numpy as np
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.model_selection import train_test_split
import numpy as np
import pandas as pd
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import roc_auc_score
from sklearn.metrics import classification_report

data_path ='/data/bigfiles/5297379b-7cd5-4239-bcac-e2d361753393'
df = pd.read_csv(data_path, delimiter='\t',header=None)
######Begin ######

# 将label编码
df[0] = df[0].replace(to_replace=['spam', 'ham'], value=[0, 1])

# 完成数据划分及词向量的转化
X = df[1].values
y = df[0].values
X_train_raw,X_test_raw,y_train,y_test=train_test_split(X,y,random_state = 0)
vectorizer = TfidfVectorizer()
x_train = vectorizer.fit_transform(X_train_raw)
x_test = vectorizer.transform(X_test_raw) 

# 构建模型及训练
model = MultinomialNB()
model.fit(x_train,y_train)

#对于测试集x_test进行预测
x_pre_test=model.predict(x_test)
x_pro_test = model.predict_proba(x_test)
#计算验证集的auc值,参数为预测值和概率估计
auc=roc_auc_score(y_test, x_pro_test[:, 1])
###### End ######
print("auc的值：{}".format(auc))

C爱吃可爱多

关注

6
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

C爱吃可爱多 CSDN认证博客专家 CSDN认证企业博客

码龄4年

4: 原创

157万+: 周排名

93万+: 总排名

9328: 访问

: 等级

51: 积分

16: 粉丝

10: 获赞

2: 评论

35: 收藏

私信

关注

热门文章

最新评论

头歌实训平台—实用机器学习-2023-线性回归模型
CSDN-Ada助手: 恭喜你开始博客创作！你选择的主题“头歌实训平台—实用机器学习-2023-线性回归模型”非常有深度和实用性。线性回归模型是机器学习领域中的重要基础，你选择这个主题是一个很好的起点。在你的下一篇博客中，我建议你可以探讨一下线性回归模型在实际应用中的案例，例如如何利用头歌实训平台进行房价预测或销售量预测等。这样的实际案例会更加引人入胜，也能帮助读者更好地理解线性回归模型的应用。继续努力写作，期待你的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
头歌实训平台—实用机器学习-2023-线性回归案例
CSDN-Ada助手: 非常棒的博客！看到你在探索实用机器学习的案例，我感到非常兴奋。你的摘要已经很清晰地介绍了你要实现的任务和目标。希望你能继续写下去，分享更多实用的机器学习案例。除了线性回归，还有其他机器学习算法可以用来解决房价预测问题。比如，你可以尝试使用决策树、支持向量机等算法。此外，特征工程也是非常重要的一步，你可以尝试去提取更多有价值的特征，比如计算房屋周边设施的密度等等。希望我提到的这些内容对你有所帮助。期待看到你更多的博客，继续加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
头歌实训平台--实用机器学习--朴素贝叶斯模型
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“头歌实训平台--实用机器学习--朴素贝叶斯模型”听起来非常吸引人。您的博客内容一定对那些对机器学习感兴趣的读者们非常有帮助。接下来，我希望能给出一些建议，以供您在下一步的创作中参考。您可以考虑对朴素贝叶斯模型进行更深入的探索，或者介绍其他实用的机器学习算法。此外，您还可以分享一些实际应用案例，以帮助读者更好地理解和运用这些技术。但是，请记住，我只是提供一些建议，您对自己的创作方向有最终的决定权。我期待着阅读您未来的博客，谢谢您的不断努力！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
头歌实训平台—实用机器学习-2023-实验3逻辑回归算法
CSDN-Ada助手: 恭喜您写完了第四篇博客！标题中提到了实用机器学习和逻辑回归算法，这是当前颇受关注的热门话题。您的博客内容一定给读者带来了很多的启发和帮助。继续坚持写作，分享您的学习和经验，将会对更多人产生积极的影响。在下一步的创作中，建议您可以进一步深入探讨实验3逻辑回归算法的应用场景和实践经验，结合实际案例进行分析和讨论。此外，您也可以考虑分享一些关于机器学习实训平台的使用技巧和最佳实践，这将对那些对于实用机器学习感兴趣的读者非常有帮助。保持谦虚的态度，持续努力，相信您的博客会越来越好！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。