自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 典型相关分析

一.概述     典型相关分析研究的是两组变量之间的相关关系。我们借用PCA降维的思想,先从两组变量中分别提取主成分u和v,然后u和v的相关程度达到最大,这样就把研究两组变量之间的相关问题转化为研究两个变量u和v之间的相关问题。     设x=(x1,x2,...,xp)'和y=(y1,y2,...yp)'是两组随机变量     典型相关分析需要研究x的线性函数u=a'x与y的线性函数

2015-12-28 09:45:26 6946 1

原创 因子分析

一.因子分析概述     昨天介绍了主成分分析(PCA),PCA能起到很好的降维作用,但要对多个主成分进行符合实际意义的解释比较困难,在昨天的例子中,只有前两个主成分F1和F2能得到较好的解释。而因子分析可以看作是对PCA的一种推广和发展,通过因子旋转可以使变量在降维之后能得到更好的解释。因子分析和PCA的不同还在于因子分析需要构造一个因子模型,原始变量是因子的线性组合。    因

2015-12-27 09:28:05 4796

原创 PCA

一.PCA概述     PCA是常用的数据降维方法。当数据维度较高,变量个数多且有一定程度的相关性时,变量间的信息存在重叠,此时利用主成分分析(PCA)能够将多个变量化为少数几个互不相关的主成分。这些主成分通常表示为原始变量的线性组合,它们能够反映原始数据大部分的信息,并且所含的信息互不重叠。    设x=(x1,x2,...xp)'为一个p维随机向量,用变换y=T'x得到主成分向量y

2015-12-26 13:00:36 970

原创 K近邻算法

这篇博客也是自己以前在新浪上写的,搬算法思想:在存在训练样本集(已知数据以及相应的分类标签)的基础上,输入没有分类标签的新数据后,将新数据的每个特征与训练样本集中的对应每个特征进行比较,然后提取样本集中特征最为相似的数据分类标签,作为新数据的对应分类标签。一般情况下,我们选择训练样本集中与输入数据欧式距离最短的k个数据,最后选择k个数据中出现次数最多的分类,作为新数据的分类。p

2015-12-26 12:53:40 415

原创 Logistic回归

以前在新浪上写博客的,研一开学一直忙,博客没更,考虑到CSDN是专业的技术平台,把博客搬家到这里。进入正题:算法思想:              二项logistic回归模型是一种分类模型,服从如下的条件概率分布:              P(Y=1|x)=exp(w.x)/(1+exp(w.x))       P(Y=0|x)=1/(1+exp(w.x))

2015-12-20 16:13:59 369

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除