图像处理基本概念、术语

最新推荐文章于 2024-06-02 01:19:51 发布

五道口纳什

最新推荐文章于 2024-06-02 01:19:51 发布

阅读量3.4k

点赞数

分类专栏：数字图像处理

本文链接：https://blog.csdn.net/lanchunhui/article/details/50476465

版权

数字图像处理专栏收录该内容

37 篇文章 8 订阅

订阅专栏

time domain：时域，如speech signal；spatial domain：空域，如image
transform domain：变换域，如傅里叶域的傅里叶系数，小波域的小波系数
corpus：预料库（文本建模基本术语），一般由多篇文档构成的可称为预料库，记一篇文档 $d=\vec w=(w_1,w_2,\ldots,w_n)$ （由 $n$ 个单词构成）；
signal corruption：noise, missing data and outliers.
on many benchmark visual datasets for different tasks
performance metrics（性能度量）
streaming workflows with pipelines

1. 计算机视觉的挑战

viewpoint variation：视角
scale variation：尺度
deformation：变形
occlusion：遮挡
illumination conditions：照明
background clutter：前景背景混淆
Intra-class variation：类内的差异

2. DC（direct current）

直流。

一个图像块的 DC，通常意味着其均值。还记得二维傅里叶变换，

$F (u, v) = \sum x \sum y f (x, y) e - i 2 π (u x / M + v y / N)$ $F(u,v)=\sum_x\sum_y f(x,y)e^{-i2\pi (ux/M+vy/N)}$

其在(0, 0)（频率原点），

$F (0, 0) = \sum x \sum y f (x, y)$ $F(0,0)=\sum_x\sum_y f(x,y)$
就对应着直流分量。

3. Population Sparsity（种群稀疏） vs Lifetime Sparsity（存在稀疏）

F n \times m = W n \times d \cdot X d \times m

$F_{n\times m}=W_{n\times d}\cdot X_{d\times m}$

$d$ ：表示原有的特征空间
$n$ ：变换后的特征空间
$m$ ：样本的数目
$F$ ：特征矩阵（Feature Matrix）

每个样本都只用很少的激活（非零）特征来描述。具体来说，对于特征矩阵的每一列（一个样本） $f(i)$ ，只有很少的非零元素。其他的都是0 。例如，一幅图像可以由里面包含的一些目标来描述，如果里面存在很多可能的目标，那么在某一时刻，也只可能出现一些。我们称之为population sparsity（种群稀疏）。

好的特征应该是具有区分性的，这样才可以区分样本。例如需要区分人脸和人手，那么很明显，肤色不是区分性的特征，因为人脸和人手都有肤色。但如果看有没有眼睛，那么就很容易区分是人脸还是人手了，所以眼睛就是一个区分性的特征。所以要区分样本，就要选择样本独有的，而不是大家都有的特征。稍微学术点的表达就是，每个特征只允许在少量的样本内被激活。也就是说，在特征矩阵中，每一行（一种特征）应该只有少量的非零元素。这个特征的属性被称为lifetime sparsity（存在稀疏）。

4. High Dispersal（高分散性）

对每一行（一种特征在不同样本的时候的不同取值）的特征的分布，应该和其他行的特征的分布相似，或者说每种特征都应该具有相似的统计特性。具体来说，对矩阵的每一行，我们取该行所有元素（一种特征在不同样本的时候的不同取值）的平方后的均值作为其统计特性的描述。每一行都存在一个均值，那么每行的均值都应该是一样的，这样就可以认为所有的特征都具有相似的分布。这种属性我们称之为 high dispersal（高分散性）。但对于一个好的特征描述来说，这个属性并不是必要的。但它可以防止特征的退化，也就是可以防止提取到相同的特征（如果提取到相同的特征，那么特征既冗余，又没有增加信息量，所以一般都要求提取到的特征是正交的）。对于过完备的特征表达。high dispersal 可以理解为只有很少的 inactive 不活跃的特征。例如，PCA编码一般不会满足 high dispersal，因为大的特征值对应的特征向量（也就是特征code）大部分总是活跃active的。

五道口纳什

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
图像处理基本概念、术语

计算机视觉的挑战viewpoint variation：视角scale variation：尺度deformation：变形occlusion：遮挡illumination conditions：照明background clutter：前景背景混淆Intra-class variation：类内的差异
复制链接

扫一扫