一、对应分析的基本思想
对应分析和主成分分析和因子分析方法有着密切的联系。对应分析主要适用于变量X和变量Y之间不独立的情形,是从R型因子分析出发直接获得Q型因子分析的结果,从而克服由于样本容量大所带来的困难。具体来说,从原始数据矩阵出发构建过渡矩阵,在得变量的协方差矩阵和样品的协方差(其非零特征值相同,其特征根之间存在特定关系)。特征值是各个公共因子的方差,可用相同的因子轴同时表示变量点和样本点。
二、对应分析的原理
原始数据样本矩阵为 且假设样本矩阵中所有的元素均大于0
样本矩阵行和列分别作和所得
某种属性出现的“概率” 称该矩阵为对应矩阵
过渡矩阵 这由对应矩阵对应变化(中心化和标准化)后而得
最后对过渡矩阵进行因子分析即可
三、对应分析的入门实例
#读入数据################################
case8.1<-read.csv('eg8.1.csv',heading=T)
Z=case8.1[,-1]#第一行为地名等文字信息,不能参与分析
chisq.test(Z)##对样本数据进行卡方检验,若p值小,则可认为不独立,可进行对应分析
#做对应分析,计算行和列的得分##############
library(MASS)
ca1=corresp(Z,nf=2)
ca1
#绘制对应分析图##########################
rownames(ca1$rscore)=case8.1[,1]
biplot(ca1,cex=0.55)#行命名为第一列样本名称
abline(v=0,h=0,lty=3)#作图并分象限
根据图示可以将样本初步分类
本篇文章是笔者学习所得,若有不妥谬误之处还望温和批评指正