RTextTools简介
古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本分类开发包。
它集成了(或者说支持)如下算法相关的包:
-
支持向量机(Support Vector Machine from e1071)
-
glmnet(一个非常流行的用于变量选择的R包,俗称kaggle竞赛“三驾马车”之一)
-
最大熵模型(maximum entropy from maxent)
-
大规模线性判别(scaled linear discriminant,slda)
-
装袋算法(bagging from ipred)
-
提升算法(boosting from caTools)
-
随机森林(random forest from randomForest)
-
神经网络(neural networks from nnet)
-
回归树(regression tree from tree)
RTextTools有着不可不学的三大理由:
-
首先,RTextTools的设计哲学在于易学与灵活。从而,让没有任何R编程经验的社会科学研