《R语言与统计分析》-多元统计分析

本文深入解析了多元统计分析中的主成分分析、因子分析,以及Fisher判别分析,涵盖了计算距离的不同方法,如欧氏距离和聚类分析中的层次聚类。此外,还包括典型相关分析和对应分析,为理解数据挖掘与机器学习提供实用工具。
摘要由CSDN通过智能技术生成
####多元统计分析####
####主成分分析####
princomp(formula, data = NULL, subset, na.action, ...)

princomp(x, cor = FALSE, scores = TRUE, covmat = NULL,
         subset = rep_len(TRUE, nrow(as.matrix(x))), fix_sign = TRUE, ...)
#cor = FALSE,表示用样本的协方差阵S做主成分
#cor = T,表示用样本的相关阵R做主成分

####因子分析####
factanal(x, factors, data = NULL, covmat = NULL, n.obs = NA,
         subset, na.action, start = NULL,
         scores = c("none", "regression", "Bartlett"),
         rotation = "varimax", control = NULL, ...)
#factors表示因子个数

####Fisher判别分析####
library(MASS)
lda(formula, data, ..., subset, na.action)

####计算距离####
dist(x, method = "euclidean", diag = FALSE, upper = FALSE, p = 2)
#"euclidean", "maximum", "manhattan", 
#"canberra", "binary", "minkowski"

# average Linkage 类平均法
# centroid method 重心法
# median method 中间距离法
# complete method 最长距离法
# single method 最短距离法
# ward method 离差平方和法
# density method 密度估计法

####聚类分析####
hclust(d, method = "complete", members = NULL)
#d是“dist”构成的距离结构,method是系统聚类的方法

####典型相关分析####
cancor(x, y, xcenter = TRUE, ycenter = TRUE)
#xcenter = TRUE, ycenter = TRUE表示数据是否中心化处理

####对应分析####
library(MASS)
corresp(x, nf = 1, ...)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值