【毕业设计】Python实现基于数据挖掘的垃圾短信数据识别分类 毕业论文+项目源码及数据

摘要

短信业务的迅猛发展在丰富了人们的沟通方式的同时,同样遭受到垃圾短信的困扰。对于运营商来说,垃圾短信造成基础设施资源的巨大浪费;对于移动用户来说,大量的垃圾短信使用户不能够及时查看正常的短信,干扰了用户的正常生活。垃圾短信的识别已经成为一个亟待解决的问题,而传统的基于黑白名单、关键字进行过滤的效果有限,不能起到很好的识别效果。针对该问题,我们基于垃圾短信的文本内容,将文本分类算法应用到垃圾短信的分类中。我们使用了SVM、LR、GBDT和决策树算法进行垃圾短信的识别工作,最后我们制作了线上演示系统。结果显示系统在垃圾短信的识别上有着良好的表现。

关键词:垃圾短信、文本分类、GBDT、LR

目录

摘要

一、 概述

二、 相关工作

三、 数据分析

四、 研究方法

4.1 逻辑回归(Logistic Regression)

4.2 支撑向量机(SVM)

4.3 决策树(Decision Tree)

4.4 梯度提升决策树(GBDT)

则此时的负梯度误差为

五、 实验设计

5.1 逻辑回归(Logistic Regression)模型

5.1.1 逻辑回归分类器训练

5.1.2 实验结果及分析

5.2 支持向量机(Support Vector Machine)模型

5.2.1 数据预处理

5.2.2 训练模型

5.2.3 模型评估

5.3 决策树(Decision Tree)模型

5.3.1 决策树分类器训练

5.3.2 实验结果及分析

5.4 梯度提升决策树(GBDT)模型

5.4.1 GBDT分类器训练

5.4.2 实验结果及分析

5.5 垃圾短信识别系统

六、总结

参考文献


 


 


 


 


 

  • 22
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员小马软件开发定制

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值