Django 垃圾短信分类

最新推荐文章于 2024-05-29 16:02:34 发布

cuixuange

最新推荐文章于 2024-05-29 16:02:34 发布

阅读量884

点赞数

分类专栏： machine-learning 文章标签：垃圾短信分类中科院网络数据挖掘 Django 朴素贝叶斯分类

本文链接：https://blog.csdn.net/u014297722/article/details/78822635

版权

背景:
给出任意一条短信，判断其是否为垃圾短信
https://github.com/cuixuage/Machine_Learning

对于垃圾短信分类问题做一个demo展示
1.前端ajax+后端Django
2.训练的数据模型的存放在static中；单例模式保证了训练模型只会加载一次
3.缺点: 第一次打开页面花费时间较长，需要等待server加载资源完毕。 (异步操作如何解决？？？)

算法模型:
朴素贝叶斯； jieba分词；SK-learn中的countvectorizer提取文本的特征；
注:特征提取有多种方法也进行试验了IG MI WLLR方式

效果如下:

不同特征提取方式对比
Recall 被预测正确的垃圾短信 占据所有被预测为垃圾短信的比例
Precision 被预测正确的垃圾短信 占据所有真实垃圾短信的比例

Naive Bayes
CountVectorizer
Recall:

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注