一些特征选择方法(II)

最新推荐文章于 2024-06-21 11:17:49 发布

王先生的副业

最新推荐文章于 2024-06-21 11:17:49 发布

阅读量410

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/uncle_gy/article/details/80392361

版权

机器学习专栏收录该内容

46 篇文章 3 订阅

订阅专栏

LDA

PCA

参考：http://blog.codinglabs.org/articles/pca-tutorial.html
假设我们只有a和b两个字段，那么我们将它们按行组成矩阵 $X$ ：

X = (\begin{matrix} a_{1} & a_{2} & \dots & a_{m} \\ b_{1} & b_{2} & \dots & b_{m} \end{matrix})

$X=\begin{pmatrix} a_1 & a_2 & \cdots & a_m \\ b_1 & b_2 & \cdots & b_m \end{pmatrix}$
然后我们用

X X $X$ 乘以

X

$X$ 的转置，并乘上系数

1/m 1 / m $1/m$ ：

1 m X X T = (1 m \sum m i = 1 a 2 i 1 m \sum m i = 1 a i b i 1 m \sum m i = 1 a i b i 1 m \sum m i = 1 b 2 i)

$\frac{1}{m}XX^\mathsf{T}=\begin{pmatrix} \frac{1}{m}\sum_{i=1}^m{a_i^2} & \frac{1}{m}\sum_{i=1}^m{a_ib_i} \\ \frac{1}{m}\sum_{i=1}^m{a_ib_i} & \frac{1}{m}\sum_{i=1}^m{b_i^2} \end{pmatrix}$
设我们有

m m $m$ 个

n

$n$ 维数据记录，将其按列排成

n n $n$ 乘

m

$m$ 的矩阵

X X $X$ ，设

C = \frac{1}{m} X X^{T}

$C=\dfrac{1}{m}XX^T$ ，则

C C $C$ 是一个对称矩阵，其对角线分别个各个字段的方差，而第i行j列和j行i列元素相同，表示i和j两个字段的协方差。

协方差矩阵对角化

设原始数据矩阵 $X$ 对应的协方差矩阵为 $C$ ，而 $P$ 是一组基按行组成的矩阵，设 $Y=PX$ ，则 $Y$ 为 $X$ 对 $P$ 做基变换后的数据。设 $Y$ 的协方差矩阵为 $D$ ，我们推导一下 $D$ 与 $C$ 的关系：

\begin{array}{lll} D & = & \frac{1}{m} Y Y^{T} \\ = & \frac{1}{m} (P X) (P X)^{T} \\ = & \frac{1}{m} P X X^{T} P^{T} \\ = & P (\frac{1}{m} X X^{T}) P^{T} \\ = & P C P^{T} \end{array}

$\begin{array}{l l l} D & = & \frac{1}{m}YY^\mathsf{T} \\ & = & \frac{1}{m}(PX)(PX)^\mathsf{T} \\ & = & \frac{1}{m}PXX^\mathsf{T}P^\mathsf{T} \\ & = & P(\frac{1}{m}XX^\mathsf{T})P^\mathsf{T} \\ & = & PCP^\mathsf{T} \end{array}$
协方差矩阵C是一个是对称矩阵，在线性代数上，实对称矩阵有一系列非常好的性质：

1）实对称矩阵不同特征值对应的特征向量必然正交。

2）设特征向量λ重数为r，则必然存在r个线性无关的特征向量对应于λ，因此可以将这r个特征向量单位正交化。
由上面两条可知，一个n行n列的实对称矩阵一定可以找到n个单位正交特征向量，设这n个特征向量为 $e_1,e_2,⋯,e_n$ ，我们将其按列组成矩阵：