2015年12月_彼得纲

12月

原创典型相关分析

一.概述典型相关分析研究的是两组变量之间的相关关系。我们借用PCA降维的思想，先从两组变量中分别提取主成分u和v，然后u和v的相关程度达到最大，这样就把研究两组变量之间的相关问题转化为研究两个变量u和v之间的相关问题。设x=(x1,x2,...,xp)'和y=(y1,y2,...yp)'是两组随机变量典型相关分析需要研究x的线性函数u=a'x与y的线性函数

2015-12-28 09:45:26 6946 1

原创因子分析

一.因子分析概述昨天介绍了主成分分析（PCA），PCA能起到很好的降维作用，但要对多个主成分进行符合实际意义的解释比较困难，在昨天的例子中，只有前两个主成分F1和F2能得到较好的解释。而因子分析可以看作是对PCA的一种推广和发展，通过因子旋转可以使变量在降维之后能得到更好的解释。因子分析和PCA的不同还在于因子分析需要构造一个因子模型，原始变量是因子的线性组合。因

2015-12-27 09:28:05 4796

原创 PCA

一.PCA概述 PCA是常用的数据降维方法。当数据维度较高，变量个数多且有一定程度的相关性时，变量间的信息存在重叠，此时利用主成分分析（PCA）能够将多个变量化为少数几个互不相关的主成分。这些主成分通常表示为原始变量的线性组合，它们能够反映原始数据大部分的信息，并且所含的信息互不重叠。设x=(x1,x2,...xp)'为一个p维随机向量，用变换y=T'x得到主成分向量y

2015-12-26 13:00:36 970

原创 K近邻算法

这篇博客也是自己以前在新浪上写的，搬算法思想：在存在训练样本集（已知数据以及相应的分类标签）的基础上，输入没有分类标签的新数据后，将新数据的每个特征与训练样本集中的对应每个特征进行比较，然后提取样本集中特征最为相似的数据分类标签，作为新数据的对应分类标签。一般情况下，我们选择训练样本集中与输入数据欧式距离最短的k个数据，最后选择k个数据中出现次数最多的分类，作为新数据的分类。p

2015-12-26 12:53:40 415

原创 Logistic回归

以前在新浪上写博客的，研一开学一直忙，博客没更，考虑到CSDN是专业的技术平台，把博客搬家到这里。进入正题：算法思想：二项logistic回归模型是一种分类模型，服从如下的条件概率分布： P(Y=1|x)=exp(w.x)/(1+exp(w.x)) P(Y=0|x)=1/(1+exp(w.x))

2015-12-20 16:13:59 369

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 典型相关分析

原创 因子分析

原创 PCA

原创 K近邻算法

原创 Logistic回归

空空如也

空空如也

原创典型相关分析

原创因子分析