[PCA]主成分析

简单介绍

主成分析是要找到维度中有用的部分,那么就要知道什么样的维度是没有用的:

  • 不能反映出个体之间的差别
  • 和其他的维度的相关性很高,会随着其他维度的变化有规律的变化

第一点可以用方差来衡量,而第二点可以用协方差来衡量,这样就有下面PCA的代码了。


代码实现

代码是用python写的,用到numpy:

from numpy import *;
import Image;

def pca(data, dimen) :
	'''
	data:
		an array of sample, normalization processed. 
	dimen:
		dimension of the main component.
	'''
	# process the data.
	avgs = [];
	for d in data :
		avg = mean(d, axis=0);
		d -= avg;
		avgs.append(avg);
	
	# covariance matrix.	
	c = cov(data);

	# get eigenvalues and eigenvectors.
	values,vectors = linalg.eig(c);
	
	# get the max values.
	index = (argsort(values)[::-1])[0:dimen];
	values = values[:,index];
	vectors = vectors[:,index];

	new_data = dot(transpose(vectors), data);
	restore = dot(vectors, new_data);
	
	print '------ old ------'
	print data;
	print '------ new ------'
	print restore;

	return vectors;

# TEST
if __name__ == '__main__' :
	data = array([[1,5,6],[4,3,9],[4,2,9],[4,7,2]]);
	pca(data, 2);	
----------

END

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值