【论文精读系列】之《Learning Background-Aware Correlation Filters for Visual Tracking》其三

西园啜茗

于 2020-12-24 12:45:29 发布

阅读量624

点赞数 1

分类专栏： CV 文章标签：计算机视觉目标跟踪离散时间傅立叶变换

本文链接：https://blog.csdn.net/qq_39800591/article/details/111596911

版权

CV 专栏收录该内容

7 篇文章 2 订阅

订阅专栏

【论文精读系列】之《Learning Background-Aware Correlation Filters for Visual Tracking》其三

4 Background-Aware Correlation Filters（背景感知相关滤波器）

论文地址：《Learning Background-Aware Correlation Filters for Visual Tracking》

注：该篇博客中，为了明确矩阵或者向量的形状，常出现诸如 $(\boldsymbol A)_{m,n}$ 或者 $(\boldsymbol b)_{n,1}$ 的表示，则表明 $\boldsymbol A$ 是一个 $m$ 行 $n$ 列的矩阵，而 $\boldsymbol b$ 则是 $n$ 行 1 列的列向量。

4 Background-Aware Correlation Filters（背景感知相关滤波器）

首先要对先前博客的内容做一个更正：
在上一篇博客中指出， $\boldsymbol x$ 表示拥有 $D$ 个像素的单帧图像，这是为了便于后续的说明，事实上， $\boldsymbol x$ 真正表示的是单帧图像中拥有 $D$ 个像素的一个图像块（块中包含目标）。

上图整个是一帧图像， $\boldsymbol x$ 表示图中蓝色框内的图像块，它包含了目标（bird），且一共有 $D$ 个像素（多通道的话每个特征通道都有 $D$ 个像素）。
如先前博客所述，我们需要更多的来自背景的真实样本，因此论文扩大了选取的图像块的大小。
现在 $\boldsymbol x$ 表示图中绿色框内的图像块，它包含了目标（bird），且一共有 $T$ 个像素（多通道的话每个特征通道都有 $T$ 个像素）。
那么现在有了绿色框内图像块，我们还想把先前小范围精确包含目标（bird）的蓝色框内的图像块提取出来，怎么操作？
论文提出一个裁剪矩阵 $(\boldsymbol P)_{D,T}$ ，其中元素不是 0 就是 1 ，它可以完成这个任务。
补充说明3（开始）：
不妨举一个例子（单通道），绿色框内图像块记为 $Image_{green}$ ，其为
$Image_{green}=\begin{bmatrix} 255 & 255 & 255 & 255 \\ 255 & 255 & 255 & 255 \\ 255 & 255 & 0 & 255 \\ 255 & 255 & 255 & 255 \\ \end{bmatrix}$ 其中灰度值为 0 的像素为目标（目标就一个像素），示意图如下图

蓝色框内的图像块记为 $Image_{blue}$ ，其为
$Image_{blue}=\begin{bmatrix} 255 & 255 \\255 & 0 \end{bmatrix}$ 向量化之后分别有
$\boldsymbol x_{blue}=\begin{bmatrix} 255 \\ 255 \\255\\0 \end{bmatrix}= \begin{bmatrix} 0&0&0&0&0&1&0&0&0&0&0&0&0&0&0&0\\ 0&0&0&0&0&0&1&0&0&0&0&0&0&0&0&0\\0&0&0&0&0&0&0&0&0&1&0&0&0&0&0&0\\0&0&0&0&0&0&0&0&0&0&1&0&0&0&0&0\end{bmatrix} \begin{bmatrix} 255 \\ 255 \\255\\255\\255\\255\\255\\255\\255\\255\\0\\255\\255\\255\\255\\255 \end{bmatrix}=\boldsymbol P\boldsymbol x_{green}$ 补充说明3（结束）

有了上述的说明，便可以引出论文核心的公式，公式（3）如下：
$E(\boldsymbol h)=\frac{1}{2}{\sum_{j=1}^T\lVert y(j)-\sum_{k=1}^K\boldsymbol h_k^T\boldsymbol P\boldsymbol x_k[\Delta{\boldsymbol\tau}_j]\rVert_2^2}+\frac{\lambda}{2}\sum_{k=1}^K\lVert{\boldsymbol h}_k\rVert_2^2\tag{3}$ 相比公式（2），仅仅是每一特征通道的图像块 $\boldsymbol x_k$ 变为了 $T$ 行 1 列，并使用裁剪矩阵 $(\boldsymbol P)_{D,T}$ 进行裁剪。对裁剪后的 $(\boldsymbol P\boldsymbol x_k[\Delta{\boldsymbol\tau}_j])_{D,1}$ 进行滤波，同样需要滤波器 $(\boldsymbol h)_{D,1}$ ，可以看出滤波器的尺寸没有变化，因而需要学习的参数没有增多。
需要指明的是：实际操作时， $T\gg D$ ，一般在 4 倍左右。

为了提高计算效率，相关滤波器通常在频域中学习。下面将公式（3）进行频域表达，即对其进行离散傅里叶变换（DFT）。

补充说明4（开始）：
任一离散数字信号序列 $(\boldsymbol a)_{N,1}$ ，其离散傅里叶变换结果为 $(\hat \boldsymbol a)_{N,1}$ ，有：
$(\hat \boldsymbol a)_{N,1}=\sqrt{N}(\boldsymbol F)_{N,N}(\boldsymbol a)_{N,1}$ 其中矩阵 $\boldsymbol F$ 如下
$\boldsymbol F=\frac{1}{N}\begin{bmatrix} 1&1&1&\cdots&1 \\1&W_N^1&W_N^2&\cdots&W_N^{N-1}\\ 1&W_N^2&W_N^4&\cdots&W_N^{2(N-1)}\\\vdots&\vdots&\vdots&\ddots&\vdots\\1 &W_N^{N-1}&W_N^{2(N-1)}&\cdots&W_N^{(N-1)(N-1)}\end{bmatrix}_{N,N}$ 可以看出 $\sqrt{N}\boldsymbol F$ 是复数基向量的正交矩阵（即酉矩阵），用于将任何 $N$ 维矢量化信号映射到傅立叶域。为了便于理解，仍需做四点说明：
① 上述矩阵 $\boldsymbol F$ 对应的傅里叶逆变换矩阵如下
$\boldsymbol F^{-1}=\begin{bmatrix} 1&1&1&\cdots&1 \\1&W_N^{-1}&W_N^{-2}&\cdots&W_N^{-(N-1)}\\ 1&W_N^{-2}&W_N^{-4}&\cdots&W_N^{-2(N-1)}\\\vdots&\vdots&\vdots&\ddots&\vdots\\1 &W_N^{-(N-1)}&W_N^{-2(N-1)}&\cdots&W_N^{-(N-1)(N-1)}\end{bmatrix}_{N,N}$ 且有 $(\sqrt{N}\boldsymbol F)^{-1}(\sqrt{N}\boldsymbol F)=(\sqrt{N}\boldsymbol F)(\sqrt{N}\boldsymbol F)^{-1}=\boldsymbol I$
② 在很多地方可以看见 $\boldsymbol F$ 也有别的定义方式，如
$\boldsymbol F=\frac{1}{\sqrt{N}}\begin{bmatrix} 1&1&1&\cdots&1 \\1&W_N^1&W_N^2&\cdots&W_N^{N-1}\\ 1&W_N^2&W_N^4&\cdots&W_N^{2(N-1)}\\\vdots&\vdots&\vdots&\ddots&\vdots\\1 &W_N^{N-1}&W_N^{2(N-1)}&\cdots&W_N^{(N-1)(N-1)}\end{bmatrix}_{N,N}$ $\boldsymbol F^{-1}=\frac{1}{\sqrt{N}}\begin{bmatrix} 1&1&1&\cdots&1 \\1&W_N^{-1}&W_N^{-2}&\cdots&W_N^{-(N-1)}\\ 1&W_N^{-2}&W_N^{-4}&\cdots&W_N^{-2(N-1)}\\\vdots&\vdots&\vdots&\ddots&\vdots\\1 &W_N^{-(N-1)}&W_N^{-2(N-1)}&\cdots&W_N^{-(N-1)(N-1)}\end{bmatrix}_{N,N}$ 对于这个问题，可以参照维基百科词条 DFT matrix 的解释，简而言之就是，矩阵 $\boldsymbol F$ 和 $\boldsymbol F^{-1}$ 前的归一化因子可以任意选取，只要保证 $\boldsymbol F^{-1}\boldsymbol F=\boldsymbol F\boldsymbol F^{-1}=\boldsymbol I$ 即可，但是我们选取 $\boldsymbol F=\frac{1}{N}\begin{bmatrix} 1&1&1&\cdots&1 \\1&W_N^1&W_N^2&\cdots&W_N^{N-1}\\ 1&W_N^2&W_N^4&\cdots&W_N^{2(N-1)}\\\vdots&\vdots&\vdots&\ddots&\vdots\\1 &W_N^{N-1}&W_N^{2(N-1)}&\cdots&W_N^{(N-1)(N-1)}\end{bmatrix}_{N,N}$ 时，可以保证 $\sqrt{N}\boldsymbol F$ 是酉矩阵（在论文中 $\sqrt{N}\boldsymbol F$ 才是离散傅里叶变换矩阵，而非 $\boldsymbol F$ ）。若 $\sqrt{N}\boldsymbol F$ 是酉矩阵，则有 $(\sqrt{N}\boldsymbol F)^H(\sqrt{N}\boldsymbol F)=(\sqrt{N}\boldsymbol F)(\sqrt{N}\boldsymbol F)^H=\boldsymbol I$ ，这会给傅里叶域计算带来便捷。
③ 矩阵元素中的 $W_N=e^{-i\frac{2\pi}{N}}$ ，因此当 $N = 4$ 时，有 $W_4=e^{-i\frac{2\pi}{4}}=-i$
$\sqrt{4}\boldsymbol F=\frac{1}{\sqrt{4}}\begin{bmatrix} 1&1&1&1 \\1&-i&-1&i\\ 1&-1&1&-1\\1 &i&-1&-i\end{bmatrix}_{4,4}$ 易验证上面是一个酉矩阵。 $W_N=e^{-i\frac{2\pi}{N}}$ （称之为旋转因子）还有计算性质如下
• 周期性 $W_N^n=W_N^{n+rN}$
• 共轭对称性 $W_N^n=(W_N^{-n})^*$
• 可约性 $W_{rN}^{rn}=W_N^n$
• 正交性 $\frac{1}{N}\sum_{n=0}^{N-1}W_{N}^{kn}(W_N^{mn})^*=\frac{1}{N}\sum_{n=0}^{N-1}W_{N}^{(k-m)n}=\begin{cases} 1,&k=m \\ 0,&k \neq m \end{cases}$
④ $(\hat \boldsymbol a)_{N,1}=\sqrt{N}(\boldsymbol F)_{N,N}(\boldsymbol a)_{N,1}$ 是矩阵形式的表达，DFT 及 IDFT 常见写法如下
$\hat a(k)=\frac{1}{\sqrt{N}}\sum_{n=0}^{N-1} a(n)W_N^{nk},k=0,1,\cdots,N-1$ $a(n)=\frac{1}{\sqrt{N}}\sum_{k=0}^{N-1}\hat a(k)W_N^{-nk},n=0,1,\cdots,N-1$ 补充说明4（结束）

下面我们考虑将公式（3）变换到频域（傅氏域）：
有了上述的补充说明，便可以进行下述推导：
重点先看公式（3）的第一项（省略系数 $\frac{1}{2}$ ） ${\sum_{j=1}^T\lVert y(j)-\sum_{k=1}^K\boldsymbol h_k^T\boldsymbol P\boldsymbol x_k[\Delta{\boldsymbol\tau}_j]\rVert_2^2}$ 将其展开写可写成：
$\begin{bmatrix} y(1)-\begin{pmatrix}\langle\boldsymbol P^T\boldsymbol h_1,\boldsymbol x_1[\Delta{\boldsymbol\tau}_1]\rangle+\langle\boldsymbol P^T\boldsymbol h_2,\boldsymbol x_2[\Delta{\boldsymbol\tau}_1]\rangle+\cdots+\langle\boldsymbol P^T\boldsymbol h_K,\boldsymbol x_K[\Delta{\boldsymbol\tau}_1]\rangle\end{pmatrix} \end{bmatrix}^2+$ $\begin{bmatrix} y(2)-\begin{pmatrix}\langle\boldsymbol P^T\boldsymbol h_1,\boldsymbol x_1[\Delta{\boldsymbol\tau}_2]\rangle+\langle\boldsymbol P^T\boldsymbol h_2,\boldsymbol x_2[\Delta{\boldsymbol\tau}_2]\rangle+\cdots+\langle\boldsymbol P^T\boldsymbol h_K,\boldsymbol x_K[\Delta{\boldsymbol\tau}_2]\rangle\end{pmatrix} \end{bmatrix}^2$ $+\cdots +$ $\begin{bmatrix} y(T)-\begin{pmatrix}\langle\boldsymbol P^T\boldsymbol h_1,\boldsymbol x_1[\Delta{\boldsymbol\tau}_T]\rangle+\langle\boldsymbol P^T\boldsymbol h_2,\boldsymbol x_2[\Delta{\boldsymbol\tau}_T]\rangle+\cdots+\langle\boldsymbol P^T\boldsymbol h_K,\boldsymbol x_K[\Delta{\boldsymbol\tau}_T]\rangle\end{pmatrix} \end{bmatrix}^2$ 将上述展开式看成一个 “大” 的 2-范数的平方，即 $\lVert(\boldsymbol y)_{T,1}-(\boldsymbol z)_{T,1}\rVert_2^2$ ，其中 $z(j)=\sum_{k=1}^K\langle\boldsymbol P^T\boldsymbol h_k,\boldsymbol x_k[\Delta{\boldsymbol\tau}_{j+1}]\rangle,j=0,1,\cdots,T-1$ 显然有对 $\boldsymbol y$ 的 DFT： $\hat\boldsymbol y=\sqrt{T}\boldsymbol F\boldsymbol y$
下面考虑对 $\boldsymbol z$ 的 DFT， $\hat\boldsymbol z$ ，显然有：
$\hat\boldsymbol z=\sqrt{T}\boldsymbol F\boldsymbol z=$ $\frac{1}{\sqrt{T}}\begin{bmatrix} 1&1&1&\cdots&1 \\1&W_T^1&W_T^2&\cdots&W_T^{T-1}\\ 1&W_T^2&W_T^4&\cdots&W_T^{2(T-1)}\\\vdots&\vdots&\vdots&\ddots&\vdots\\1 &W_T^{T-1}&W_T^{2(T-1)}&\cdots&W_T^{(T-1)(T-1)}\end{bmatrix}_{T,T}\begin{bmatrix}\langle\boldsymbol P^T\boldsymbol h_1,\boldsymbol x_1[\Delta{\boldsymbol\tau}_1]\rangle+\langle\boldsymbol P^T\boldsymbol h_2,\boldsymbol x_2[\Delta{\boldsymbol\tau}_1]\rangle+\cdots+\langle\boldsymbol P^T\boldsymbol h_K,\boldsymbol x_K[\Delta{\boldsymbol\tau}_1]\rangle\\\langle\boldsymbol P^T\boldsymbol h_1,\boldsymbol x_1[\Delta{\boldsymbol\tau}_2]\rangle+\langle\boldsymbol P^T\boldsymbol h_2,\boldsymbol x_2[\Delta{\boldsymbol\tau}_2]\rangle+\cdots+\langle\boldsymbol P^T\boldsymbol h_K,\boldsymbol x_K[\Delta{\boldsymbol\tau}_2]\rangle\\\vdots\\\langle\boldsymbol P^T\boldsymbol h_1,\boldsymbol x_1[\Delta{\boldsymbol\tau}_T]\rangle+\langle\boldsymbol P^T\boldsymbol h_2,\boldsymbol x_2[\Delta{\boldsymbol\tau}_T]\rangle+\cdots+\langle\boldsymbol P^T\boldsymbol h_K,\boldsymbol x_K[\Delta{\boldsymbol\tau}_T]\rangle\end{bmatrix}_{T,1}$ 写成另外一种形式为： $\hat z(i)=\frac{1}{\sqrt{T}}\sum_{j=0}^{T-1} z(j)W_N^{ji}=\frac{1}{\sqrt{T}}\sum_{j=0}^{T-1}\sum_{k=1}^K\langle\boldsymbol P^T\boldsymbol h_k,\boldsymbol x_k[\Delta{\boldsymbol\tau}_{j+1}]\rangle W_N^{ji},i=0,1,\cdots,T-1$ 利用公式 $\lambda\langle \boldsymbol a,\boldsymbol b\rangle=\langle \boldsymbol a,\lambda \boldsymbol b\rangle$ 则有：
$\hat z(i)=\frac{1}{\sqrt{T}}\sum_{j=0}^{T-1}\sum_{k=1}^K\langle\boldsymbol P^T\boldsymbol h_k,\boldsymbol x_k[\Delta{\boldsymbol\tau}_{j+1}]W_N^{ji}\rangle$ 交换求和顺序（互换符号 $\sum$ ）：
$\hat z(i)=\frac{1}{\sqrt{T}}\sum_{k=1}^K\sum_{j=0}^{T-1}\langle\boldsymbol P^T\boldsymbol h_k,\boldsymbol x_k[\Delta{\boldsymbol\tau}_{j+1}]W_N^{ji}\rangle$ 利用公式 $\sum\langle \boldsymbol a,\boldsymbol b_j\rangle=\langle \boldsymbol a,\sum \boldsymbol b_j\rangle$ 则有：
$\hat z(i)=\frac{1}{\sqrt{T}}\sum_{k=1}^K\langle\boldsymbol P^T\boldsymbol h_k,\sum_{j=0}^{T-1}\boldsymbol x_k[\Delta{\boldsymbol\tau}_{j+1}]W_N^{ji}\rangle=\sum_{k=1}^K\langle\boldsymbol P^T\boldsymbol h_k,\frac{1}{\sqrt{T}}\sum_{j=0}^{T-1}\boldsymbol x_k[\Delta{\boldsymbol\tau}_{j+1}]W_N^{ji}\rangle$ 上式中 $(\boldsymbol x_k[\Delta{\boldsymbol\tau}_{j+1}])_{T,1}$ 为，写开有如下：
$\hat z(i)=\sum_{k=1}^K\langle\boldsymbol P^T\boldsymbol h_k,\frac{1}{\sqrt{T}}\begin{bmatrix}\boldsymbol x_k[\Delta{\boldsymbol\tau}_1] &\boldsymbol x_k[\Delta{\boldsymbol\tau}_2] &\cdots &\boldsymbol x_k[\Delta{\boldsymbol\tau}_{T}] \end{bmatrix}\begin{bmatrix} W_T^{0i}\\W_T^{1i}\\\vdots\\W_T^{(T-1)i}\end{bmatrix}\rangle$
$=\sum_{k=1}^K(\boldsymbol h_k^T\boldsymbol P\frac{1}{\sqrt{T}}\begin{bmatrix}\boldsymbol x_k[\Delta{\boldsymbol\tau}_1] &\boldsymbol x_k[\Delta{\boldsymbol\tau}_2] &\cdots &\boldsymbol x_k[\Delta{\boldsymbol\tau}_{T}] \end{bmatrix}\begin{bmatrix} W_T^{0i}\\W_T^{1i}\\\vdots\\W_T^{(T-1)i}\end{bmatrix})$
$=\sum_{k=1}^K\langle{\begin{bmatrix}\boldsymbol x_k[\Delta{\boldsymbol\tau}_1]^T\\\boldsymbol x_k[\Delta{\boldsymbol\tau}_2]^T\\\vdots\\\boldsymbol x_k[\Delta{\boldsymbol\tau}_T]^T\end{bmatrix}}\boldsymbol P^T\boldsymbol h_k,\frac{1}{\sqrt{T}}\begin{bmatrix} W_T^{0i}\\W_T^{1i}\\\vdots\\W_T^{(T-1)i}\end{bmatrix}\rangle=\langle\sum_{k=1}^K{\begin{bmatrix}\boldsymbol x_k[\Delta{\boldsymbol\tau}_1]^T\\\boldsymbol x_k[\Delta{\boldsymbol\tau}_2]^T\\\vdots\\\boldsymbol x_k[\Delta{\boldsymbol\tau}_T]^T\end{bmatrix}}\boldsymbol P^T\boldsymbol h_k,\frac{1}{\sqrt{T}}\begin{bmatrix} W_T^{0i}\\W_T^{1i}\\\vdots\\W_T^{(T-1)i}\end{bmatrix}\rangle$
$=\left(\sum_{k=1}^K\boldsymbol h_k^T\boldsymbol P\begin{bmatrix}\boldsymbol x_k[\Delta{\boldsymbol\tau}_1] &\boldsymbol x_k[\Delta{\boldsymbol\tau}_2] &\cdots&\boldsymbol x_k[\Delta{\boldsymbol\tau}_{T}] \end{bmatrix}\right)_{1,T}\left(\frac{1}{\sqrt{T}}\begin{bmatrix} W_T^{0i}\\W_T^{1i}\\\vdots\\W_T^{(T-1)i}\end{bmatrix}\right)_{T,1}$
因此 $\hat\boldsymbol z^T=[\hat z(0),\hat z(1),\cdots,\hat z(T-1)]$ 为：
$\hat\boldsymbol z^T=\left(\sum_{k=1}^K\boldsymbol h_k^T\boldsymbol P\begin{bmatrix}\boldsymbol x_k[\Delta{\boldsymbol\tau}_1] &\boldsymbol x_k[\Delta{\boldsymbol\tau}_2] &\cdots&\boldsymbol x_k[\Delta{\boldsymbol\tau}_{T}] \end{bmatrix}\right)_{1,T}\left(\frac{1}{\sqrt{T}} \begin{bmatrix} W_T^{0}&W_T^{0}&\cdots&W_T^{0}\\W_T^{0}&W_T^{1}&\cdots&W_T^{T-1}\\\vdots&\vdots&\ddots&\vdots\\W_T^{0}&W_T^{1(T-1)}&\cdots&W_T^{(T-1)(T-1)}\end{bmatrix}\right)_{T,T}$
$=\left(\sum_{k=1}^K\boldsymbol h_k^T\boldsymbol P\begin{bmatrix}\boldsymbol x_k[\Delta{\boldsymbol\tau}_1] &\boldsymbol x_k[\Delta{\boldsymbol\tau}_2] &\cdots&\boldsymbol x_k[\Delta{\boldsymbol\tau}_{T}] \end{bmatrix}\right)_{1,T}\left(\sqrt{T} \boldsymbol F\right)_{T,T}$
记矩阵如下：
$\boldsymbol X_k={\begin{bmatrix}\boldsymbol x_k[\Delta{\boldsymbol\tau}_1]^T\\\boldsymbol x_k[\Delta{\boldsymbol\tau}_2]^T\\\vdots\\\boldsymbol x_k[\Delta{\boldsymbol\tau}_T]^T\end{bmatrix}}={\begin{bmatrix}x_k(1)&x_k(2)&\cdots&x_k(T)\\x_k(T)&x_k(1)&\cdots&x_k(T-1)\\\vdots&\vdots&\ddots&\vdots\\x_k(2)&x_k(3)&\cdots&x_k(1)\end{bmatrix}}$ 很明显每一个 $\boldsymbol X_k(k=1,2,\cdots,K)$ 是一个循环矩阵，我们可以很方便地对循环矩阵进行 DFT 。
这样，可以写出：
$\hat\boldsymbol z^T=\sum_{k=1}^K\boldsymbol h_k^T\boldsymbol P\boldsymbol X_k^T\sqrt{T}\boldsymbol F$ 写成列向量的形式，需要进行转置（ $\boldsymbol F=\boldsymbol F^T$ ）：
$\hat\boldsymbol z=\sum_{k=1}^K\boldsymbol F\boldsymbol X_k\sqrt{T}\boldsymbol P^T\boldsymbol h_k$
补充说明5（开始）：
循环矩阵的重要性质：
任一循环矩阵均可以被离散傅里叶变换矩阵对角化
证明略，详见维基百科词条 Circulant matrix
及由博客【目标跟踪: 相关滤波器三】循环矩阵可知：
若使用论文定义的 $\boldsymbol F$ ，则有：
$(\hat\boldsymbol X_k)_{T,T}=(\sqrt{T}\boldsymbol F)_{T,T}\cdot (diag({\boldsymbol x}_k))_{T,T}\cdot(\sqrt{T}\boldsymbol F^H)_{T,T}$ 又
$(\sqrt{T}\boldsymbol F)^H(\sqrt{T}\boldsymbol F)=(\sqrt{T}\boldsymbol F)(\sqrt{T}\boldsymbol F)^H=\boldsymbol I$ 且由于 $(\sqrt{T}\boldsymbol F)^T=(\sqrt{T}\boldsymbol F)$ ，故可得： $(diag({\boldsymbol x}_k))_{T,T}=(\sqrt{T}\boldsymbol F)_{T,T}\cdot (\hat\boldsymbol X_k)_{T,T}\cdot(\sqrt{T}\boldsymbol F)_{T,T}^H$ 补充说明5（结束）

利用上述说明，有：
$\hat\boldsymbol z=\sum_{k=1}^K\boldsymbol F\boldsymbol X_k\boldsymbol F^H\boldsymbol F\sqrt{T}\boldsymbol P^T\boldsymbol h_k$ 记 $\boldsymbol X_k$ 的生成向量的傅里叶变换为 $\hat\boldsymbol x_k$ ，则：
$\hat\boldsymbol z=\sum_{k=1}^K diag(\hat\boldsymbol x_k)\sqrt{T}(\boldsymbol F\boldsymbol P^T)\boldsymbol h_k\tag{*}$ 不妨记 $\boldsymbol g_k$ ，有
$(\hat\boldsymbol g_k)_{T,1}=\sqrt{T}(\boldsymbol F)_{T,T}(\boldsymbol P^T{\boldsymbol h}_k )_{T,1}=\sqrt{T}(\boldsymbol F)_{T,T}(\boldsymbol P^T)_{T,D}({\boldsymbol h}_k )_{D,1}$ 再进行如下设计：
将滤波器的 $k$ 个分量并成一个特别长的列向量 $(\boldsymbol h)_{(D\times K),1}$
$\boldsymbol h=\begin{bmatrix} \boldsymbol h_1\\\boldsymbol h_2\\ \vdots\\\boldsymbol h_K\end{bmatrix}=\begin{bmatrix} {\begin{bmatrix}h_1(1)&h_1(2)&\cdots&h_1(D)\end{bmatrix}}^T\\{\begin{bmatrix}h_2(1)&h_2(2)&\cdots&h_2(D)\end{bmatrix}}^T\\ \vdots\\{\begin{bmatrix}h_K(1)&h_K(2)&\cdots&h_K(D)\end{bmatrix}}^T\end{bmatrix}$ 现在的 $\boldsymbol h$ 是 $D\times K$ 行 1 列的列向量，裁剪矩阵 $(\boldsymbol P)_{D,T}$ 无法直接与 $(\boldsymbol h)_{(D\times K),1}$ 进行计算（尺寸不匹配），因此我们需要引入克罗内克积（Kronecker Product），记其运算符为 $\otimes$ 。

补充说明6（开始）：
矩阵 $(\boldsymbol A)_{m,n}$ 和 $(\boldsymbol B)_{p,q}$ 进行克罗内克积运算，则有 $(\boldsymbol A\otimes\boldsymbol B)_{(m\times p),(n\times q)}$ ，具体如下
$\boldsymbol A\otimes\boldsymbol B={\begin{bmatrix}a_{11}\boldsymbol B&a_{12}\boldsymbol B&\cdots&a_{1n}\boldsymbol B\\ a_{21}\boldsymbol B&a_{22}\boldsymbol B&\cdots&a_{2n}\boldsymbol B \\ \vdots&\vdots&\ddots&\vdots\\a_{m1}\boldsymbol B&a_{m2}\boldsymbol B&\cdots&a_{mn}\boldsymbol B \end{bmatrix}}$ 例如
$\begin{bmatrix}a_{11}&a_{12}\\ a_{21}&a_{22}\\a_{31}&a_{32}\end{bmatrix}\otimes\begin{bmatrix}b_{11}&b_{12}&b_{13}\\ b_{21}&b_{22}&b_{23}\end{bmatrix}= \begin{bmatrix}a_{11}b_{11}&a_{11}b_{12}&a_{11}b_{13}&a_{12}b_{11}&a_{12}b_{12}&a_{12}b_{13}\\ a_{11}b_{21}&a_{11}b_{22}&a_{11}b_{23}&a_{12}b_{21}&a_{12}b_{22}&a_{12}b_{23}\\ a_{21}b_{11}&a_{21}b_{12}&a_{21}b_{13}&a_{22}b_{11}&a_{22}b_{12}&a_{22}b_{13}\\ a_{21}b_{21}&a_{21}b_{22}&a_{21}b_{23}&a_{22}b_{21}&a_{22}b_{22}&a_{22}b_{23}\\ a_{31}b_{11}&a_{31}b_{12}&a_{31}b_{13}&a_{32}b_{11}&a_{32}b_{12}&a_{32}b_{13}\\ a_{31}b_{21}&a_{31}b_{22}&a_{31}b_{23}&a_{32}b_{21}&a_{32}b_{22}&a_{32}b_{23}\end{bmatrix}$ 补充说明6（结束）

由上述说明，可知：若定义单位阵 $(\boldsymbol I_K)_{K,K}$ ，则有
$((\boldsymbol F)_{T,T}(\boldsymbol P^T)_{T,D})_{T,D}\otimes (\boldsymbol I_K)_{K,K}=(\boldsymbol F\boldsymbol P^T\otimes\boldsymbol I_K)_{(T\times K),(D\times K)}$ 这样便可以与设计的特别长的列向量 $(\boldsymbol h)_{(D\times K),1}$ 进行运算，如下：
$(\hat\boldsymbol g)_{(T\times K),1}=\sqrt{T}(\boldsymbol F\boldsymbol P^T\otimes\boldsymbol I_K)_{(T\times K),(D\times K)}(\boldsymbol h)_{(D\times K),1}$ 若记 $\hat\boldsymbol X$ 为：
$\hat\boldsymbol X=\begin{bmatrix}diag(\hat\boldsymbol x_1)^T,diag(\hat\boldsymbol x_2)^T,\cdots,diag(\hat\boldsymbol x_K)^T\end{bmatrix}$ 这样 $(*)$ 式可以写成：
$\hat\boldsymbol X\sqrt{T}(\boldsymbol F\boldsymbol P^T\otimes\boldsymbol I_K)\boldsymbol h$ 引入等式表达（用于后续 ADMM 求解）： $\hat\boldsymbol g=\sqrt{T}(\boldsymbol F\boldsymbol P^T\otimes\boldsymbol I_K)\boldsymbol h$ 最后得到频域表达式，公式（4）：
$E(\boldsymbol h,\hat\boldsymbol g)=\frac{1}{2}\lVert\hat\boldsymbol y-\hat\boldsymbol X\hat\boldsymbol g\rVert_2^2+\frac{\lambda}{2}\lVert\boldsymbol h\rVert_2^2\tag{3}$

参考链接：
辨析matmul product（一般矩阵乘积），hadamard product（哈达玛积）、kronecker product（克罗内克积）
【目标跟踪: 相关滤波器三】循环矩阵

西园啜茗

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
【论文精读系列】之《Learning Background-Aware Correlation Filters for Visual Tracking》其三

【论文精读系列】之《Learning Background-Aware Correlation Filters for Visual Tracking》其三4 Background-Aware Correlation Filters（背景感知相关滤波器）论文地址：《Learning Background-Aware Correlation Filters for Visual Tracking》注：该篇博客中，为了明确矩阵或者向量的形状，常出现诸如 (A)m,n(\boldsymbol A)_{m,n}
复制链接

扫一扫

专栏目录