数据挖掘基本算法

数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。R语言博大精深,吸纳了来自各方的挖掘算法包,这些包都是由统计学家或是算法研究人员提供,我们可以站在这些伟人的肩膀上实现算法的应用。下面对常用的数据挖掘包做一个汇总:
连续因变量的预测:
stats包
lm函数,实现多元线性回归
stats包 
glm函数,实现广义线性回归
stats包 
nls函数,实现非线性最小二乘回归
rpart包
rpart函数,基于CART算法的分类回归树模型
RWeka包
M5P函数,模型树算法,集线性回归和CART算法的优点
adabag包 
bagging函数,基于rpart算法的集成算法
adabag包 
boosting函数,基于rpart算法的集成算法
randomForest包
randomForest函数,基于rpart算法的集成算法
e1071包
svm函数,支持向量机算法
kernlab包 
ksvm函数,基于核函数的支持向量机
nnet包 
nnet函数,单隐藏层的神经网络算法
neuralnet包
neuralnet函数,多隐藏层多节点的神经网络算法
RSNNS包 
mlp函数,多层感知器神经网络
RSNNS包
rbf函数,基于径向基函数的神经网络


离散因变量的分类:
stats包 
glm函数,实现Logistic回归,选择logit连接函数
stats包 
knn函数,k最近邻算法
kknn包 
kknn函数,加权的k最近邻算法
rpart包 
rpart函数,基于CART算法的分类回归树模型
adabag包
bagging函数,基于rpart算法的集成算法
adabag包
boosting函数,基于rpart算法的集成算法
randomForest包
randomForest函数,基于rpart算法的集成算法
party包
ctree函数,条件分类树算法
RWeka包
OneR函数,一维的学**规则算法
RWeka包
JPip函数,多维的学**规则算法
RWeka包
J48函数,基于C4.5算法的决策树
C50包
C5.0函数,基于C5.0算法的决策树
e1071包
svm函数,支持向量机算法
kernlab包
ksvm函数,基于核函数的支持向量机
e1071包
naiveBayes函数,贝叶斯分类器算法
klaR包
NaiveBayes函数,贝叶斯分类器算分
MASS包
lda函数,线性判别分析
MASS包
qda函数,二次判别分析
nnet包
nnet函数,单隐藏层的神经网络算法
RSNNS包
mlp函数,多层感知器神经网络
RSNNS包
rbf函数,基于径向基函数的神经网络


聚类:
Nbclust包
Nbclust函数可以确定应该聚为几类
stats包
kmeans函数,k均值聚类算法
cluster包
pam函数,k中心点聚类算法
stats包
hclust函数,层次聚类算法
fpc包
dbscan函数,密度聚类算法
fpc包
kmeansruns函数,相比于kmeans函数更加稳定,而且还可以估计聚为几类
fpc包
pamk函数,相比于pam函数,可以给出参考的聚类个数
mclust包
Mclust函数,期望最大(EM)算法


关联规则:
arules包
apriori函数,Apriori关联规则算法
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值