基于支持向量机的垃圾邮件分类，使用SVM+flask+vue

桃宝护卫队

已于 2024-06-19 13:58:51 修改

阅读量351

点赞数 5

文章标签：支持向量机分类 flask

于 2024-06-19 13:54:45 首次发布

本文链接：https://blog.csdn.net/qq_36463299/article/details/139801094

版权

sms-classify

基于支持向量机的垃圾邮件分类，使用SVM+flask+vue
数据集和源码地址

数据集 SMS Spam Collection Data Set 来源于 UCI。样例被分为非垃圾邮件（86.6%）和垃圾邮件（13.4%），数据格式如下：

ham Go until jurong point, crazy.. Available only in bugis n great world la e buffet... 
ham	Ok lar... Joking wif u oni...
spam	Free entry in 2 a wkly comp to win FA Cup final tkts 21st May 2005. 
ham	U dun say so early hor... U c already then say...

代码结构

- client: 前端实现
- server: 后端实现
    - models: svm model
        - sms_classify.py: 垃圾邮件分类实现
        - SMSSpamCollection: 数据集
    - app.py 系统实现
- svm.py: 支持向量机算法实现
- svm_test.py：算法test

性能评估

综合比较了垃圾邮件分类任务在支持向量机、朴素贝叶斯、最近邻、决策树算法下的性能，
评估指标包括accuracy、precision、recall、f1-score等。

从accuracy来看，支持向量机的accuracy为98%，是所有测试算法中最高的，可以看出
垃圾邮件分类任务适合使用支持向量机来做。

各算法表现具体如下表：

支持向量机：

             precision    recall  f1-score   support

           0       0.98      1.00      0.99       482
           1       1.00      0.86      0.92        76

    accuracy                           0.98       558
   macro avg       0.99      0.93      0.96       558
weighted avg       0.98      0.98      0.98       558

支持向量机的accuracy有 98.029%。

贝叶斯算法：

         precision    recall  f1-score   support

           0       0.94      1.00      0.97       482
           1       1.00      0.62      0.76        76

    accuracy                           0.95       558
   macro avg       0.97      0.81      0.87       558
weighted avg       0.95      0.95      0.94       558

贝叶斯算法的accuracy只有 94.803%。

最近邻算法：

     precision    recall  f1-score   support

           0       0.97      0.99      0.98       482
           1       0.93      0.83      0.88        76

    accuracy                           0.97       558
   macro avg       0.95      0.91      0.93       558
weighted avg       0.97      0.97      0.97       558

最近邻算法的accuracy为 96.774%。

决策树算法：

       precision    recall  f1-score   support

           0       0.97      0.98      0.98       482
           1       0.88      0.79      0.83        76

    accuracy                           0.96       558
   macro avg       0.92      0.89      0.90       558
weighted avg       0.96      0.96      0.96       558

决策树算法的accuracy为 95.699%。

如何运行

首先安装必要的包

# 创建虚拟环境
python -m venv env
# 激活虚拟环境
source env/bin/activate
# 安装依赖包
pip install -r requirements.txt

运行SVM算法实现

# 确保安装 matplotlib 和 numpy
python3 svm_test.py

运行垃圾邮件分类

~ cd server/models/
~ python3 sms_classify.py

运行垃圾邮件分类系统

server端

# 确保安装必要的包
# 启动flask
python app.py

client端

# 确保安装node & npm
npm install
npm run server

桃宝护卫队

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于支持向量机的垃圾邮件分类，使用SVM+flask+vue

基于支持向量机的垃圾邮件分类，使用SVM+flask+vue数据集 SMS Spam Collection Data Set 来源于。
复制链接

扫一扫