空间向量模型 LSA/LSI LDA 词向量方法 上一个数据集的贝叶斯方案 VSM方案正确率90.1%使用tfidf方法对文本标准化之后得到的文本向量进行贝叶斯分类,正确率为90.0% 原因大概是去掉stopwords后的论文的的词汇都较为简练,毕竟惜字如金哈!所以,各个词的权重分布不是很明显。