java垃圾邮件分类器_正常邮件还是垃圾邮件?机器学习的SMS文本分类

057ede7d43d78832d87e78ed9b7bffc5.png

作者 | Deepal Dsilva

来源 | Towards Data Science

编辑| 代码医生团队

介绍

在过去的十年里,移动电话的使用量急剧上升,导致了一个新的垃圾场促销活动。人们在利用日常服务时无辜地发出手机号码,然后充斥着垃圾邮件促销信息。

在这篇文章中,我们将看看使用朴素贝叶斯机器学习模型对SMS消息进行分类,了解为什么朴素贝叶斯能够很好地适应这个用例,并且还可以潜入wordclouds来可视化这个数据集。让我们开始吧!

导入库和数据

我们将使用SMS Spam Collection中的数据集来创建垃圾邮件分类器。这可以从UCI机器学习库下载。

https://archive.ics.uci.edu/ml/datasets/SMS+Spam+Collection

此数据集包括SMS消息的文本以及指示消息是否不需要的标签。垃圾邮件标记为垃圾邮件,而合法邮件标记为火腿。

#Import libraries

library(tm)

library(SnowballC)

library(wordcloud)

library(RColorBrewer)

library(e1071)         #For Naive Bayes

library(caret)         #For the Confusion Matrix

#Import data

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值