黄耀鹏:R语言中文社区专栏作者,一名数据科学研究者及科普写作者。
个人博客:http://yphuang.github.io/
往期回顾
RTextTools简介
古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本分类开发包。
它集成了(或者说支持)如下算法相关的包:
支持向量机(Support Vector Machine from e1071)
glmnet(一个非常流行的用于变量选择的R包,俗称kaggle竞赛“三驾马车”之一)
最大熵模型(maximum entropy from maxent)
大规模线性判别(scaled linear discriminant,slda)
装袋算法(bagging from ipred)
提升算法(boosting from caTools)
随机森林(random forest from randomForest)
神经网络(neural networks from nnet)
回归树(regression tree from tree)
RTextTools有着不可不学的三大理由:
首先,RTextTools的设计哲学在于易学与灵活。从而,让没有任何R编程经验的社会科学研究者也能轻松实现高端的机器学习算法;并且,让经验老道的R用户充分发挥R的威力,与其他相关的包结合,如: