LSA, SVM和多层感知机用于垃圾短信分类

环境: python2.7

依赖的包: sklearn numpy jieba

database.py 用于处理数据,包括提取tf-idf向量和使用LSA进行数据的降维, 降维到100维,train_data.npy, train_label.npy, test_data.npy, test_label.npy都是保存的处理好的数据;nnp_train.py 是多层感知机的训练模型,感知机隐含层两层,分别为8和5个节点,训练完后保存模型为nnp_model_1.m, nnpClassify.py是在测试集上测试多层感知机分类模型;stopwords.txt为中文停用词集;svm_train.py是svm的训练模型,C取1,训练完后保存模型为svm_model_1.m, svmClassify.py是svm分类模型在测试集上的测试.

程序的运行顺序是:先运dataBase.py, nnp_train.py, nnpClassify.py, svm_train.py,svmClassify.py以查看两种方法的训练效果和测试效果.

项目地址:LSA, SVM和多层感知机用于垃圾短信分类

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值