统计分析与SAS
彼得纲
应用统计小硕,数据挖掘方向,侧重机器学习算法的应用。目前Python是主力语言,R用的少,在看Java,也在点分布式计算(Hadoop、Spark)方面的技能,Linux、数据结构、数据库进阶中。
展开
-
因子分析
一.因子分析概述 昨天介绍了主成分分析(PCA),PCA能起到很好的降维作用,但要对多个主成分进行符合实际意义的解释比较困难,在昨天的例子中,只有前两个主成分F1和F2能得到较好的解释。而因子分析可以看作是对PCA的一种推广和发展,通过因子旋转可以使变量在降维之后能得到更好的解释。因子分析和PCA的不同还在于因子分析需要构造一个因子模型,原始变量是因子的线性组合。 因原创 2015-12-27 09:28:05 · 4796 阅读 · 0 评论 -
PCA
一.PCA概述 PCA是常用的数据降维方法。当数据维度较高,变量个数多且有一定程度的相关性时,变量间的信息存在重叠,此时利用主成分分析(PCA)能够将多个变量化为少数几个互不相关的主成分。这些主成分通常表示为原始变量的线性组合,它们能够反映原始数据大部分的信息,并且所含的信息互不重叠。 设x=(x1,x2,...xp)'为一个p维随机向量,用变换y=T'x得到主成分向量y原创 2015-12-26 13:00:36 · 970 阅读 · 0 评论