吴恩达机器学习作业7(下)---Principal Component Analysis(包含实现,降维应用,可视化应用)

implementing PCA

前言

PCA,即主成分分析,是流行的降维算法(无监督学习算法),其主要应用有

  1. 减小数据集的特征维度,从而减小内存或者磁盘储存的消耗
  2. 提升算法效率,加快算法的运行
  3. 将数据集的特征维度减小到3维及以下,方便可视化
    在这里插入图片描述
代码分析

首先导入类库

import numpy as np
import matplotlib.pyplot as plt
import scipy.io #Used to load the OCTAVE *.mat files
from random import sample #Used for random initialization
import scipy.misc #Used to show matrix as an image
import matplotlib.cm as cm #Used to display images in a specific colormap
from scipy import linalg #Used for the "SVD" function
import imageio
from mpl_toolkits.mplot3d import Axes3D 

%matplotlib inline

导入数据并可视化

datafile = 'data/ex7data1.mat'
mat = scipy.io.loadmat( datafile )
X = mat['X']

#Quick plot
plt.figure(figsize=(7,5))
plot = plt.scatter(X[:,0], X[:,1], s=30, facecolors='none', edgecolors='b')
plt.title("Example Dataset",fontsize=18)
plt.grid(True)

在这里插入图片描述
下面开始编写PCA算法

数据集标准化函数

def featureNormalize(myX):
    means = np.mean(myX,axis=0)#对每列求均值
    myX_norm = myX - means
    stds  = np.std(myX_norm,axis=0)#对每列求标准差σ
    myX_norm = myX_norm / stds
    return means, stds, myX_norm

奇异值分解(SVD)函数,得到矩阵U,S,V

#SVD singular value decomposition
def getUSV(myX_norm):
    #求协方差矩阵
    cov_matrix = myX_norm.T.dot(myX_norm)/myX_norm.shape[0]
    # Run single value decomposition to get the U principal component matrix
    U, S, V = scipy.linalg.svd(cov_matrix, full_matrices = True, compute_uv = True)
    return U, S, V

好了,算法编写完毕

调用算法,得到参数

# Feature normalize
means, stds, X_norm = featureNormalize(X)
# Run SVD
U, S, V = getUSV(X_norm)

将principal component可视化

print('Top principal component is ',U[:,0])

#快速绘图,现在包括主成分
plt.figure(figsize=(7,5))
plot = plt.scatter(X[:,0], X[:,1], s=30, facecolors='none', edgecolors='b')
plt.title
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值