转载自 R中文论坛(http://rbbs.biosino.org/Rbbs/posts/list/192.page)
Machine Learning & Statistical Learning (机器学习 & 统计学习)
版本:2008-02-18 18:19:21
翻译:R-fox, 2008-03-18
机器学习是计算机科学和统计学的边缘交叉领域,R关于机器学习的包主要包括以下几个方面:
1)神经网络(Neural Networks):
2)递归拆分(Recursive Partitioning):
party包提供两类递归拆分算法,能做到无偏的变量选择和停止标准:函数ctree()用非参条件推断法检测自变量和因变量的关系;而函数mob()能用来建立参数模型(http://cran.r-project.org/web/packages/party/index.html)。另外,party包里也提供二分支树和节点分布的可视化展示。
3)随机森林(Random Forests):
4)Regularized and Shrinkage Methods:
5)Boosting :
6)支持向量机(Support Vector Machines):
7)贝叶斯方法(Bayesian Methods):
8)基于遗传算法的最优化(Optimization using Genetic Algorithms):
9)关联规则(Association Rules):
arules包提供了有效处理稀疏二元数据的数据结构,而且提供函数执Apriori和Eclat算法挖掘频繁项集、最大频繁项集、闭频繁项集和关联规则(http://cran.r-project.org/web/packages/arules/index.html)。
10)模型选择和确认(Model selection and validation):
11)统计学习基础(Elements of Statistical Learning):
书《The Elements of Statistical Learning: Data Mining, Inference, and Prediction 》(http://www-stat.stanford.edu/~tibs/ElemStatLearn/)里的数据集、函数、例子都被打包放在ElemStatLearn包里(http://cran.r-project.org/web/packages/ElemStatLearn/index.html)。