特征词选择算法对文本分类准确率的影响(前言)

 

作者:finallyliuyu  注:数据使用请注明来源

 

试验数据下载

资源中包括 数据集规模为200,1000,2000,3000,情况下,特征维数分别为10,20,30-150的情况下5这交叉验证的全部正确率。其中文件命名为TextCategorization_0_100_10表示这是在文档集规模为200(一个类别中有100篇文章)下进行的第一折试验,当前特征维数为10。每个这样的文件夹下面包含文件train.libsvm(训练数据集),test.libsvm(测试数据集)以及最后试验得出的准确率accuracy.txt.(我在试验中libsvm采用的是线性核)

特征词选择算法对文本分类准确率的影响(一):讨论特征选择算法是否有效

特征词选择算法对文本分类准确率的影响(二):介绍本次实验的一些前提和基础以及中间数据格式等

特征词选择算法对文本分类准确率的影响(三):讨论特征词数量,VSM模型维数对分类准确率的影响,纠正特征词数目越多,VSM模型维数越高,分类越准确的观点

特征词选择算法对文本分类准确率的影响(四):在经典概率模型(课本论文中都是此模型)下的分类准确率

特征词选择算法对文本分类准确率的影响(五):在如我一样的layman设计的概率模型下分类准确率的情况

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值