Channel Attention前言——一二阶统计量

Miracle Fan

已于 2023-12-18 15:42:50 修改

阅读量1.3k

点赞数 21

分类专栏：机器学习数学知识文章标签：计算机视觉人工智能深度学习超分辨率重建概率论

于 2023-12-07 16:23:32 首次发布

本文链接：https://blog.csdn.net/qq_49729636/article/details/134858560

版权

2 篇文章 0 订阅

订阅专栏

统计量

一阶统计量和二阶统计量是统计学中常用的两类统计量。一阶统计量是指只考虑随机变量本身的统计量，而二阶统计量则是指考虑随机变量之间关系的统计量。

一阶统计量是指只考虑随机变量本身的统计量，通常包括以下几种：

二阶统计量是指考虑随机变量之间关系的统计量，通常包括以下几种：

协方差：两个随机变量取值之间的线性相关性。

$\begin{align*} cov(X, Y) &= \sum_{x, y} (x - \mu_x)(y - \mu_y) P(X = x, Y = y) \\ &= \frac{1}{n} \sum_{x, y} (x - \mu_x)(y - \mu_y) \end{align*}$
相关系数：协方差与两个随机变量标准差的乘积的比值，反映了两个随机变量之间的线性相关程度。
$\rho_{xy} = \frac{\text{Cov}(X, Y)}{\sigma(X) \cdot \sigma(Y)}$
自协方差：随机变量取值与自身在不同时间点的取值之间的相关性。针对于时间序列
$\text{ACov}(X_t, X_s) = \frac{1}{n} \sum_{i=1}^{n-(t+s)} (X_{i+t} - \mu)(X_{i+s} - \mu)$
自相关系数：自协方差与随机变量标准差的乘积的比值，反映了随机变量在不同时间点的相关程度。针对于时间序列
$\text{ACorr}(X_t, X_s) = \frac{\text{ACov}(X_t, X_s)}{\sqrt{\text{Var}(X_t) \cdot \text{Var}(X_s)}}$

在SENet中采用全局平均池化利用一阶特征，从而产生了Channel Attention，但是其忽略了高于一阶统计量的信息。在Is Second-order Information Helpful for Large-scale Visual Recognition?和Bilinear CNN Models for Fine-grained Visual Recognition的结果显示，在深度卷积神经网络中，采用二阶统计量比一阶统计量更具有鉴别性的表示。

在SAN中则通过对Channel Attention进行改进，利用二阶统计量协方差计算各个通道的重要性，提出Second-order Channel Attention (SOCA)。