#机器学习--实例--主成分分析

投笔丶从戎

已于 2023-06-02 11:58:56 修改

阅读量396

点赞数 1

分类专栏：机器学习文章标签：机器学习 python numpy

于 2022-08-08 15:46:54 首次发布

本文链接：https://blog.csdn.net/qq_43519779/article/details/126211178

版权

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

#机器学习--实例--主成分分析

引言

本系列博客旨在为机器学习(深度学习)提供数学理论基础。因此内容更为精简，适合二次学习的读者快速学习或查阅。

主成分分析（PCA)介绍

主成分分析（principal components analysis，PCA）是一个简单的机器学习算法，能够在损失精度尽可能少的前提下，对数据进行有损压缩。

推导过程

        假设有矩阵 $A_{m,n}$ ，我们希望通过一个函数 $f$ 对其进行有损压缩，即 $C_{l,n}=f(A_{m,n})(l\le m)$ 。压缩后，我们希望能够通过一个函数 $g$ 对其进行最大程度的还原，即 $A_{m,n}\approx g(C_{l,n})$ 。
        为了使问题简化，我们令解码函数 $g(C_{l,n})=D_{m,l}C_{l,n}$ ，在此假设下，我们需要找到编码函数 $f$ ，使得信息损失最小，即：
$argmin_{C}||DC-A||_{F}$ $argmin_{C}||DC-A||_{F}^{2}$ $argmin_{C}Tr[(DC-A)(DC-A)^{T}]$ $argmin_{C}Tr(DCC^{T}D^{T}-DCA^{T}-AC^{T}D^{T}+AA^{T})$ $argmin_{C}Tr(DCC^{T}D^{T})-2Tr(DCA^{T})$ $求导，令导数为0得：D^{T}DC=D^{T}A$
        为了确保矩阵 $D$ 的唯一性，令 $D$ 中所有列向量均互为单位正交向量，即 $D^{T}D=I_{l}$ ，有 $C=D^{T}A$ ，即 $f(A)=D^{T}A$ 。至此编码函数找到了，最后一步需要找到矩阵 $D$ ，使得编码解码后的信息损失最小，即：
$argmin_{D}||A-DD^{T}A||_{F},s.t.D^{T}D=I_{l}$ $=>\argmin_{D}||A-DD^{T}A||^{2}_{F},s.t.D^{T}D=I_{l}$ $argmin_{D}Tr[(A-DD^{T}A)(A-DD^{T}A)^{T}],s.t.D^{T}D=I_{l}$ $argmin_{D}Tr(AA^{T}-2AA^{T}DD^{T}+AA^{T}DD^{T}DD^{T}),s.t.D^{T}D=I_{l}$ $argmin_{D}-Tr(AA^{T}DD^{T}),s.t.D^{T}D=I_{l}$ $根据拉格朗日乘数法，有：\argmin_{D}-Tr(AA^{T}DD^{T})+\lambda(D^{T}D-I_{l})$ $求导，令导数为0得：AA^{T}D=\lambda D$
        最终我们得出结论， $D_{l,n}$ 就是由矩阵 $AA^{T}$ 的 $l$ 个单位特征向量所构成的。若有不懂，请回顾前面的线性代数基础部分。

代码实现

import numpy as np


class PCAModel:
    def __init__(self):
        self.d = None

    def fit(self, x, target_l):
        """
        填充训练数据，进行主成分分析
        :param x: 训练数据矩阵，每一个列向量为一条训练数据
        :param target_l: 目标维度，应小于矩阵x中列向量的长度
        """
        if target_l >= x.shape[0]:
            raise ValueError("target_l should greater than x.shape[0]")
        features, f_vec = np.linalg.eig(np.matmul(x, x.T))
        self.d = f_vec[:, :target_l]

    def transform(self, x):
        """
        对数据x进行降维
        """
        return np.matmul(self.d.T, x)

    def reverse_transform(self, x):
        """
        对数据x进行还原
        """
        return np.matmul(self.d, x)


train_x = np.array([[1,2],[3,4],[5,6]])
print(train_x)
# [[1 2]
#  [3 4]
#  [5 6]]
model = PCAModel()
model.fit(tran_x, 2)
result = model.transform(train_x)
print(result)
# [[-5.90229186 -7.47652631]
#  [ 0.40367167 -0.3186758 ]]
pred_y = model.reverse_transform(result)
print(pred_y)
# [[1. 2.]
#  [3. 4.]
#  [5. 6.]]