朴素贝叶斯+SMSSpamCollections

不要em0啦

于 2024-05-24 22:56:56 发布

阅读量465

点赞数 12

分类专栏：机器学习文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2201_75642955/article/details/139186221

版权

机器学习专栏收录该内容

21 篇文章 0 订阅

订阅专栏

1. 打开 Jupyter 后，在工作目录中，新建一个文件夹命名为 Test01 ，并且在文件夹中导入数据

集。在网页端界面点击 “upload” 按钮，在弹出的界面中选择要导入的数据集。然后数据集出现

在 jupyter 文件目录中，此时点击文件后的 “upload” 按钮即可将数据集导入。

2. 点击 New->Python 3 后，跳转至 Untitled.ipynb （课后请重命名为 NBofSMS.ipynb ）

3. 导入所需的库文件并运行

4. 将广告类的标识置为 1 ，正常邮件标识为 0 ，编写创建数据集、加载数据的函数

loadDataSet() ，编写完成后编译并运行 Cell ，箭头处代码自己添加，提示：字符串转化为字符

串列表可参考本文提供的函数

5. 编写 textParse() 函数的代码并且编译运行，该函数用于接收一个大字符串并将其解析为字符串

列表

6. 在 Cell 中写入 docs2VecList() 函数的代码，该函数用于对数据集进行预处理，编写完成后编译

并运行

7. 编写 words2Vec() 函数将单词转化为词向量。

8. 在 Cell 中写训练函数，训练 Naïve Bayes 模型，完成后编译并运行

9. 编写使用 Naive Bayes 模型的接口，如果是垃圾邮件则返回 1 ，非垃圾邮件则返回 0

10. 用中文打印分类结果

11. 编写主函数调用上述函数实现本次实验

关注

12
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

不要em0啦 CSDN认证博客专家 CSDN认证企业博客

码龄2年

106: 原创

1万+: 周排名

2万+: 总排名

10万+: 访问

: 等级

2451: 积分

2987: 粉丝

1395: 获赞

15: 评论

1041: 收藏

私信

关注

热门文章

分类专栏

最新评论

联想笔记本电脑加装内存条并启用内存双通道实战
不要em0啦: 如果电脑不支持更高的频率就没必要买更好的，买了也跑不满
联想笔记本电脑加装内存条并启用内存双通道实战
Caster_Z: 对内存频率，时钟之类有要求吗？
OpenCV图像滤波、边缘检测
0仰望星空007: 大佬的文章让我对这领域的技术问题有了更深入的了解，尤其是大佬提到的那些“坑点”，我相信能够在实际应用中避免或解决很多问题。谢谢大佬的分享，期待大佬的更多精彩文章，让我们共同学习、进步。非常不错的技术领域文章分享，解决了我在实践中的大问题！博主很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，值得收藏点赞。
YOLO——AI算法的中流砥柱（二）
CSDN-Ada助手: 恭喜作者继续分享关于YOLO和AI算法的知识，文章内容相当丰富和深入。希望作者在接下来的创作中，可以进一步深挖YOLO算法的应用场景和优化方法，让读者更加全面地了解这一领域的知识。期待作者的下一篇文章！
Chat With RTX——AI也能单机用？
CSDN-Ada助手: 恭喜您写了第14篇博客！标题“Chat With RTX——AI也能单机用？”真的很吸引人，对AI在单机应用方面的探索让人十分好奇。希望您能继续保持创作的热情，不断探索新的领域，或许可以考虑深入研究AI在其他方面的应用，比如医疗、教育等领域，给读者带来更多新鲜的内容。期待您的下一篇作品！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。