【从线性回归到BP神经网络】第一部分：协方差与相关系数

最新推荐文章于 2022-08-31 10:50:22 发布

tanghonghanhaoli

最新推荐文章于 2022-08-31 10:50:22 发布

阅读量2.4k

点赞数 2

分类专栏： Machine Learning 文章标签：机器学习

本文链接：https://blog.csdn.net/tanghonghanhaoli/article/details/105631541

版权

Machine Learning 专栏收录该内容

7 篇文章 2 订阅

订阅专栏

文章目录

本文主要参考文献如下：
1、吴恩达CS229课程讲义。
2、（美）S.Chatterjee等，《例解回归分析》（第2章），机械工业出版社。
3、周志华. 《机器学习》3.2.清华大学出版社。
4、（美）P.Harrington，《机器学习实战》人民邮电出版社。

由于数据处理经常需要计算样本的统计特性，这里我们首先对此进行讨论。

1、样本均值

对于随机变量 $X$ ，其均值 $m_X={\rm E}(x)$ ，方差为 $\sigma_X^2={\rm E}[(x-m_X)^2]$ 。设有 $X$ 的样本 $\{x_1,x_2,\ldots,x_n\}$ ，则样本均值为
$\tag{1} \hat m_X=\frac{1}{n}\sum_{i=1}^{n}x_i.$

可以证明， $\hat m_x$ 是均值 $m_x$ 的无偏估计，即 ${\rm E}[\hat m_X]=m_X$ ，证明如下：
$\begin{aligned} {\rm E}[\hat m_x]&={\rm E}\left[\frac{1}{n}\sum_{i=1}^{n}x_i\right]\\ &=\frac{1}{n}\sum_{i=1}^{n}{\rm E}\left[x_i\right]\\ &=\frac{1}{n}\sum_{i=1}^{n}m_X=m_X. \end{aligned}$

2、样本方差

对于随机变量 $X$ ，其均值 $m_X={\rm E}(x)$ ，方差为 $\sigma_X^2={\rm E}[(x-m_X)^2]$ ，样本方差为
$\tag{2} \hat \sigma_X^2=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\hat m_X)^2.$

我们来看为何上式中求样本方差时，为何对 $n$ 项求和，却除以 $n - 1$ 呢？
这主要是因为我们希望 $\hat \sigma^2_X$ 是 $\sigma_X^2$ 的无偏估计，如果我们除以 $n$ ，会遇到下面情况：
$\begin{aligned} {\rm E}\left[\hat \sigma_X^2\right]&={\rm E}\left[\frac{1}{n}\sum_{i=1}^{n}(x_i-\hat m_X)^2\right]\\ &=\frac{1}{n}{\rm E}\left[\sum_{i=1}^{n}(x_i-\hat m_X)^2\right]\\ &=\frac{1}{n}{\rm E}\left[\sum_{i=1}^{n}(x_i^2+\hat m_X^2-2x_i\hat m_X)\right]\\ &={\rm E}\left[\frac{1}{n}\sum_{i=1}^{n}x_i^2-\hat m_X^2\right]\\ &=\frac{1}{n}\sum_{i=1}^{n}{\rm E}\left[x_i^2\right]-{\rm E}\left[\hat m_X^2\right]\\ &={\rm E}\left[x^2\right]-{\rm E}\left[\hat m_X^2\right]\\ &=({\rm E}\left[x^2\right]-m_X^2)-({\rm E}\left[\hat m_X^2\right]-m_X^2)\\ &=\sigma_X^2-{\rm var}[\hat m_X^2] \end{aligned}$ 由于 $\begin{aligned} {\rm var}[\hat m^2_X]&={\rm var}\left[\frac{1}{n}\sum_{i=1}^{n}x_i\right]\\ &=\frac{1}{n^2}\sum_{i=1}^{n}{\rm var}\left[x_i\right]\\ &=\frac{\sigma_X^2}{n} \end{aligned}$ 因此
$\begin{aligned} {\rm E}\left[\hat \sigma_X^2\right]=\frac{n-1}{n}\sigma_X^2 \end{aligned}$ 显然不是 $\sigma_X^2$ 的无偏估计。因此，我们将该估计进行修正，可以得到
$\begin{aligned} {\rm E}\left[\hat \sigma_X^2\right]&={\rm E}\left[\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\hat m_X)^2\right]\\ &=\frac{1}{n-1}{\rm E}\left[\sum_{i=1}^{n}(x_i-\hat m_X)^2\right]\\ &=\frac{1}{n-1}{\rm E}\left[\sum_{i=1}^{n}(x_i^2+\hat m_X^2-2x_i\hat m_X)\right]\\ &=\frac{1}{n-1}{\rm E}\left[\sum_{i=1}^{n}x_i^2-n\cdot\hat m_X^2\right]\\ &={\rm E}\left[\frac{1}{n}\sum_{i=1}^{n}x_i^2-\hat m_X^2\right]\\ &=\frac{n}{n-1}\left({\rm E}\left[x^2\right]-{\rm E}\left[\hat m_X^2\right]\right)\\ &=\sigma_X^2 \end{aligned}$ 为无偏估计。

3、协方差

下面我们来定义两个随机变量 $X$ 和 $Y$ 的样本的协方差，这里假设 $X$ 的样本为 $\{x_1,x_2,\ldots,x_n\}$ ， $Y$ 的样本为 $\{y_1,y_2,\ldots,y_n\}$ ，则有
$\tag{3} {\rm cov}(X,Y)=\frac{\sum_{i=1}^{n}(y_i-\hat m_Y)(x_i-\hat m_X)}{n-1}.$

4、相关系数

进一步，可以对两个随机变量进行标准化处理，得到 $X$ 和 $Y$ 的相关系数为
$\tag{4} \begin{aligned} {\rm cor}(Y,X)&=\frac{1}{n-1}\sum_{i=1}^{n}(\frac{y_i-\hat m_Y}{\hat\sigma_Y})(\frac{x_i-\hat m_X}{\hat \sigma_X})\\ &=\frac{1}{n-1}\sum_{i=1}^{n}\frac{(y_i-\hat m_Y)(x_i-\hat m_X)}{\hat\sigma_Y \hat \sigma_X}\\ &=\frac{\sum_{i=1}^{n}(y_i-\hat m_Y)(x_i-\hat m_X)}{\sqrt{\sum(x_i-\hat m_X)^2 \sum(x_i-\hat m_X)^2}}\\ \end{aligned}$

注意相关系数的如下性质：

${\rm cor}(Y,X)={\rm cor}(X,Y)$
$-1\le {\rm cor}(Y,X) \le 1$
相关系数只能刻画变量间线性关系的强弱。
相关系数会受到数据中一个或者几个离群值的显著影响。

5、示例：数据集的相关系数计算

下面我们看个例子。我们计算下表中的四个数据集，分别计算相关系数，并画出散点图。
在这里插入图片描述
Matlab代码如下：

A=load('Data_Chap2_Anscombe.txt')
Cor_12=corrcoef(A(:,1),A(:,2))
Cor_34=corrcoef(A(:,3),A(:,4))
Cor_56=corrcoef(A(:,5),A(:,6))
Cor_78=corrcoef(A(:,7),A(:,8))
subplot(2,2,1)
scatter(A(:,2),A(:,1))
subplot(2,2,2)
scatter(A(:,4),A(:,3))
subplot(2,2,3)
scatter(A(:,6),A(:,5))
subplot(2,2,4)
scatter(A(:,8),A(:,7))

得到相关系数为

Cor_12 =
    1.0000    0.8164
    0.8164    1.0000

Cor_34 =
    1.0000    0.8162
    0.8162    1.0000

Cor_56 =
    1.0000    0.8163
    0.8163    1.0000

Cor_78 =
    1.0000    0.8165
    0.8165    1.0000

显然，尽管相关系数基本相等，但从下图散点图中可以看出，四组数据 $Y$ 与 $X$ 的函数关系差别很大。因此在计算相关系数之前，考察散点图是非常有帮助的。

在这里插入图片描述

tanghonghanhaoli

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
【从线性回归到BP神经网络】第一部分：协方差与相关系数

文章目录1、协方差与相关系数1.1 样本均值1.2 样本方差1.3 协方差1.4 相关系数1.5 示例：数据集的相关系数计算BP神经网络多层前馈神经网络本文主要参考文献如下：1、吴恩达CS229课程讲义。2、（美）S.Chatterjee等，《例解回归分析》（第2章），机械工业出版社。3、周志华. 《机器学习》3.2.清华大学出版社。4、（美）P.Harrington，《机器学习实战》人...
复制链接

扫一扫