对应分析
对应分析(CA)是一种用于分类多元数据的统计方法。
输入
• 数据:输入数据集
输出
● 坐标:所有成分的坐标
对应分析(CA)计算输入数据的CA线性变换。虽然其与主成分分析(PCA)类似,但CA针对离散数据而非连续数据进行线性变换。
- 选择需要绘图的变量。
- 为每个坐标轴选择成分。
- 惯量值(变换中的独立性百分比,即变量处于同一维度)。
- 生成报告。
示例
以下是对应分析与散点图在泰坦尼克数据集上的简单对比。虽然散点图能较好地展示不同舱位和性别的生存率差异,但对应分析可以将多个变量绘制在二维图中,从而更直观地观察变量值之间的关系。从图中可以明显看出,“no”(未存活)、“male”(男性)和“crew”(船员)之间存在关联,而“yes”(存活)、“female”(女性)和“first”(头等舱)也呈现显著相关性。