R 回归 虚拟变量na_工具&方法 | R语言机器学习包大全(共45个包)

93fbdc37e8950ddd458fab6d8ecf83ce.png

机器学习,是一门多学科交叉的人工智能领域的分析技术,它使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测。

目前,常见机器学习的研究方向主要包括决策树、随机森林、神经网络、贝叶斯学习和支持向量机等方面。本期,我们从CRAN Task Views分类整理了有关Machine Learning主题的R语言包。 9106970fbb6c0fd39df71e23a145ed45.png

图注:图片来自scikit-learn官网

决策树 Decision Trees 1)rpart和tree ,递归拆分利用树形结构模型,来做回归、分类和生存分析。其中,rpart可用于进行分类回归树分析(Classification and Regression Tree, CART)。 rpart: https://cloud.r-project.org/web/packages/rpart/index.html tree:

https://cloud.r-project.org/web/packages/tree/index.html

2)Weka和RWeka ,weka中提供了丰富的分区算法工具箱,rweka包实现了一个接口,包括包括J4.8、C4.5、M5等。 Weka: http://www.cs.waikato.ac.nz/~ml/weka/ RWeka:

https://cloud.r-project.org/web/packages/RWeka/index.html

3)Cubist ,基于距离校正规则的回归模型(类似树模型)。

https://cloud.r-project.org/web/packages/Cubist/index.html

4)C50 ,适用C5.0分类树、基于规则的模型、以及重抽样功能。

https://cloud.r-project.org/web/packages/C50/index.html

5)party和partykit ,提供两类递归拆分算法,即无偏变量选择和统计停止准则递归分类算法。函数ctree()用非参条件推断法检测自变量和因变量关系;而函数mob()用来建立参数模型。 party: https://cloud.r-project.org/web/packages/party/index.html partykit:

https://cloud.r-project.org/web/packages/partykit/index.html

6)vcrpart ,树形变系数模型。

https://cloud.r-project.org/web/packages/vcrpart/index.html

7)LogicReg ,做逻辑回归分析,针对大多数自变量是二元变量的情况。

https://cloud.r-project.org/web/packages/LogicReg/index.html

8)maptree ,提供树结构的可视化函数。

https://cloud.r-project.org/web/packages/maptree/index.html

9)REEMtree ,纵向数据随机效应树模型。

https://cloud.r-project.org/web/packages/REEMtree/index.html

10)RPMM ,混合效应模型的分类算法。

https://cloud.r-project.org/web/packages/RPMM/index.html

随机森林 Random Forests 1)randomForest和randomForestSRC ,前者提供了用经典的随机森林做回归和分类的函数,后者对回归、分类、生存分析等进行Breiman随机森林算法。 randomForest: https://cloud.r-project.org/web/packages/randomForest/index.html randomForestSRC :

https://cloud.r-project.org/web/packages/randomForestSRC/index.html

2)ipred ,用bagging的思想做回归、分类和生存分析,组合多个模型。

https://cloud.r-project.org/web/packages/ipred/index.html

3)party ,不仅提供了递归拆分算法,还提供了基于条件推断树的随机森林法。

https://cloud.r-project.org/web/packages/party/index.html

4)quantregForest ,百分位数回归随机森林算法。

https://cloud.r-project.org/web/packages/quantregForest/index.html

5)ggRandomForests ,提供了基于ggplot2工具,用于随机森林模型的图形化探索。

https://cloud.r-project.org/web/packages/ggRandomForests/index.html

6)varSelRF和Boruta ,专注于用随机森林做变量选择。 varSelRF: https://cloud.r-project.org/web/packages/varSelRF/index.html Boruta:

https://cloud.r-project.org/web/packages/Boruta/index.html

7)ranger和Rborist ,提供接口连接到C++进行随机森林分析。 ranger: https://cloud.r-project.org/web/packages/ranger/index.html Rborist :

https://cloud.r-project.org/web/packages/Rborist/index.html

8)RLT ,强化学习树,它的特征是变量分裂。

https://cloud.r-project.org/web/packages/RLT/index.html

9)wsrf ,实现了一种替代传统随机变量采样的变权子空间选择方法。

https://cloud.r-project.org/web/packages/wsrf/index.html

10)trtf、model4you和grf ,参数模型的随机森林,如预测转换林、广义随机林等。 trtf: https://cloud.r-project.org/web/packages/trtf/index.html model4you: https://cloud.r-project.org/web/packages/model4you/index.html grf: https://cloud.r-project.org/web/packages/grf/index.html

神经网络 Neural Networks 1)nnet ,执行单隐藏层前馈神经网络。

https://cloud.r-project.org/web/packages/nnet/index.html

2)RSNNS ,提供Stuttgart Neural Network Simulator (SNNS)接口,该模拟器由斯图加特大学开发。

https://cloud.r-project.org/web/packages/RSNNS/index.html

3)deepnet、RcppDL和h2o ,实现神经网络深度学习。其中,deepnet—前馈神经网络、限制玻尔兹曼机、深度信念网络、堆叠自动编码机,Rcppdl—去噪自动编码机、堆叠去噪自动编码机、限制玻尔兹曼机、深度信念网络和h2o—前馈神经网络、深度自动编码机。 deepnet: https://cloud.r-project.org/web/packages/deepnet/index.htm l RcppDL: https://cloud.r-project.org/web/packages/RcppDL/index.html h2o:

https://cloud.r-project.org/web/packages/h2o/index.html

贝叶斯学习 Bayesian 1)BayesTree、BART和bartMachine ,贝叶斯可加回归树。 BayesTree: https://cloud.r-project.org/web/packages/BayesTree/index.html BART: https://cloud.r-project.org/web/packages/BART/index.html bartMachine:

https://cloud.r-project.org/web/packages/bartMachine/index.html

2)tgp ,提供贝叶斯半参数非线性回归。

https://cloud.r-project.org/web/packages/bartMachine/index.html

3)MXM ,实现了基于贝叶斯网络的变量选择。

https://cloud.r-project.org/web/packages/MXM/index.html

4)BDgraph ,中实现了多元连续、离散、混合数据无向图模型的贝叶斯结构学习。

https://cloud.r-project.org/web/packages/BDgraph/index.html

5)ssgraph ,基于尖峰和板先验(spike-and-slab Priors)的贝叶斯图形估计。

https://cloud.r-project.org/web/packages/ssgraph/index.html

6)naivebayes ,贝叶斯分类器运用。

https://cloud.r-project.org/web/packages/naivebayes/index.html

支持向量机 Support Vector Machines

1)e1071,svm()函数提供R接口连接到LIBSVM库。

https://cloud.r-project.org/web/packages/e1071/index.html

2)kernlab ,基于核函数的学习方法提供了一个灵活的框架,包括SUMs、RVMs、及其他科学系算法。

https://cloud.r-project.org/web/packages/kernlab/index.html

3)klaR ,提供了R接口连接到SVMlight,实现1对多的分类。

https://cloud.r-project.org/web/packages/klaR/index.html

4)rdetools ,对核特征空间的相关维度进行估计,也可进行模型的选择和预测。

https://cloud.r-project.org/web/packages/rdetools/index.html

注:以上R语言机器学习包未囊括全部机器学习命令,更多内容请关注R语言官网信息或点击左下角阅读原文

14b12ea22975633972ce9f68a3338504.png

往期推荐

回复【Python】👉简单有用易上手

回复【学术前沿】👉机器学习丨大数据

回复【数据资源】👉公开数据

回复【可视化】👉你心心念念的数据呈现

回复【老姚专栏】👉老姚趣谈值得一看

一周热文

校招丨加入企研数据,未来更多奇遇!

工具&方法 | R资源网站“四件套”推荐:教程、制图、论坛和书籍

工具&方法丨关于交互项的那些事(二):画交互效应图原来如此简单

特别推荐丨老姚专栏:理解自然实验和DID方法——与现场实验比较的视角

数据呈现 | R制图:棒棒糖图,展示地区经济发展差异

数据Seminar

这里是大数据、分析技术与学术研究的三叉路口

作者:简华(何年华) 审阅:杨奇明 编辑:青酱

    欢迎扫描👇二维码添加关注    

0830358b6ef6e44f27a4ff50989b8d85.gif

465e68839d1006c9eb1491b58f0aa285.png

6a698abd7a2d0ca492dc3bf64722ede4.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值