软阈值(Soft Thresholding)函数

最新推荐文章于 2024-06-09 13:24:19 发布

蓝子娃娃

最新推荐文章于 2024-06-09 13:24:19 发布

阅读量6.5k

点赞数 13

分类专栏：地震道插值文章标签：算法

原文链接：https://blog.csdn.net/jbb0523/article/details/52103257

版权

地震道插值专栏收录该内容

4 篇文章 1 订阅

订阅专栏

1. 软阈值(Soft Thresholding)函数的作用

软阈值(Soft Thresholding)可以求解如下优化问题：
$\argmin_x \| X - B\|_2^2 + \lambda\| x\|_1$
其中：
$[x_1, x_2, \dots, x_N]^T$
$[b_1, b_2, \dots, b_N]^T$

根据范数的定义，可以将上面优化问题的目标函数拆开：

$\|X-B \|_2^2 + \lambda\| X\|_1 \\= [(x_1-b_1)^2+\lambda \| x_1\|] + [(x_2-b_2)^2+\lambda \| x_2\|] + \dots + [(x_N-b_N)^2+\lambda \| x_N\|]$

也就是说，我们可以通过求解 $N$ 个独立的形如函数

$(x-b)^2 + \lambda |x |$

的优化问题，来求解这个问题。由中学时代学过的求极值方法知道，可以求函数 $f (x)$ 导数：

$\frac{df(x)}{dx} = 2(x-b) + \lambda \textrm{sgn}(x)$
$\textrm{sgn}(x) = 1, x > 0$
$\textrm{sgn}(x) = -1, x < 0$

这里解释一下变量 $x$ 绝对值的导数，当 $x > 0$ 时， $∣ x ∣ = x$ ，因此其导数等于 1；当 $x < 0$ 时， $∣ x ∣ = x$ ，因此其导数等于 -1；综合起来， $x$ 绝对值的导数等于 $\textrm{sgn}(x)$ 。令函数 $f (x)$ 导数等于 0，得：
$\frac{\lambda}{2} \textrm{sgn}(x)$

这个结果等号两端都有变量 $x$ ，需要再化简一下。下面分三种情况讨论：

当 $\lambda / 2$ 时

假设 $x < 0$ ，则 $\textrm{sgn}(x) = -1$ ，所以 $\lambda/2 > 0$ ，与假设 $x < 0$ 矛盾；
假设 $x > 0$ ，则 $\textrm{sgn}(x) = 1$ ，所以 $\lambda/2 > 0$ ，成立；

所以此时在 $\lambda/2 > 0$ 处取得极小值：

$f(x)|_{x = b - \lambda/2} = (b - \frac{\lambda}{2}-b)^2 + \lambda(b - \frac{\lambda}{2}) \\= b\lambda - \frac{\lambda^2}{4} \\= -(\frac{\lambda}{2})^2 + 2b\frac{\lambda}{2} \\= -(\frac{\lambda}{2})^2 + 2b\frac{\lambda}{2} - b^2 + b^2 \\= -(\frac{\lambda}{2} - b)^2 + b^2 < b^2 = f(0)$

即此时极小值小于 $f (0)$ ，而当 $x < 0$ 时

$\frac{df(x)}{dx} = 2(x-b) + \lambda \textrm{sgn}(x) \\ = 2x-2b-\lambda \\ < 2x-2(\frac{\lambda}{2}) - \lambda \\ =2x-2\lambda < 0$

即当 $x < 0$ 时函数 $f (x)$ 为单调降函数 (对任意 $\Delta x < 0, f(0) < f(\Delta x)$ )。因此，函数在 $\frac{\lambda}{2} > 0$ 处取得最小值。

当 $\lambda / 2$ 时

假设 $x < 0$ ，则 $\textrm{sgn}(x) = -1$ ，所以 $\lambda/2 < 0$ ，成立；
假设 $x > 0$ ，则 $\textrm{sgn}(x) = 1$ ，所以 $\lambda/2 < 0$ ，与假设 $x < 0$ 矛盾；

所以此时在 $\lambda/2 < 0$ 处取得极小值：

$f(x)|_{x = b + \lambda/2} = (b + \frac{\lambda}{2}-b)^2 + \lambda(b + \frac{\lambda}{2}) \\= -b\lambda - \frac{\lambda^2}{4} \\= -(\frac{\lambda}{2})^2 - 2b\frac{\lambda}{2} \\= -(\frac{\lambda}{2})^2 - 2b\frac{\lambda}{2} - b^2 + b^2 \\= -(\frac{\lambda}{2} + b)^2 + b^2 < b^2 = f(0)$

即此时极小值小于 $f (0)$ ，而当 $x > 0$ 时

$\frac{df(x)}{dx} = 2(x-b) + \lambda \textrm{sgn}(x) \\ = 2x-2b+\lambda \\ > 2x-2(-\frac{\lambda}{2}) + \lambda \\ =2x+2\lambda > 0$

即当 $x < 0$ 时函数 $f (x)$ 为单调降函数 (对任意 $\Delta x < 0, f(0) < f(\Delta x)$ )。因此，函数在 $\frac{\lambda}{2} > 0$ 处取得最小值。

当 $-\frac{\lambda}{2} < b <\frac{\lambda}{2}$ 时

假设 $x < 0$ ，则 $\textrm{sgn}(x) = -1$ ，所以 $\lambda/2 > 0$ ，与假设 $x < 0$ 矛盾；
假设 $x > 0$ ，则 $\textrm{sgn}(x) = 1$ ，所以 $\lambda/2 < 0$ ，与假设 $x > 0$ 矛盾；

即无论 $x$ 为大于 0 还是小于 0 均没有极值点，那么 $x = 0$ 是否为函数 $f (x)$ 的极值点呢？

对于 $\Delta x \neq 0$

当 $\Delta x \gt 0$ 时，利用条件 $\frac{\lambda}{2}$ 可得

$f(\Delta x) = (\Delta x)^2 + 2 \Delta xb + \lambda \Delta x + f(0)\\ > (\Delta x)^2 - 2 \Delta x \frac{\lambda}{2} + \lambda \Delta x + f(0)\\ = (\Delta x)^2 + f(0) > f(0)$

当 $\Delta x \lt 0$ 时，利用条件 $\frac{\lambda}{2}$ 可得

$f(\Delta x) = (\Delta x)^2 - 2 \Delta xb + \lambda |\Delta x| + f(0)\\ > (\Delta x)^2 - 2 \Delta x \frac{\lambda}{2} + \lambda |\Delta x| + f(0)\\ = (\Delta x)^2 + \lambda (-\Delta x) + \lambda |\Delta x| +f(0) \\ = (\Delta x)^2 + 2\lambda |\Delta x| +f(0) > f(0)$

因此，函数在 $x = 0$ 处取得最小值。
综合以上三种情况， $f (x)$ 的最小值在以下位置取得：

$\textrm{argmin} f(x) = \begin{cases} b+\frac{\lambda}{2} & ,b < -\frac{\lambda}{2} \\ 0 &, |b| < \frac{\lambda}{2} \\ b-\frac{\lambda}{2} &, b > \frac{\lambda}{2} \end{cases}$

与前面的软阈值(Soft Thresholding)对比一下，发现了么？若将上式中的 $b$ 视为变量， $\frac{\lambda}{2}$ 视为阈值，上式即为软阈值 (SoftThresholding) 的公式。

至此，我们可以得到优化问题

$\argmin_x \| X -B\|^2_2 + \lambda \| X\|_1$
的解为

$\textrm{soft}(B, \frac{\lambda}{2}) = \begin{cases} B+ \frac{\lambda}{2} & ,B < -\frac{\lambda}{2} \\ 0 &, |B| < \frac{\lambda}{2} \\ B-\frac{\lambda}{2} &, B > \frac{\lambda}{2} \end{cases}$

注：该式为软阈值(Soft Thresholding)的矩阵形式。

2. 软阈值(Soft Thresholding) 的变形

当优化问题变为

$\argmin_x \frac{1}{2}\| X-B\|_2^2 + \lambda \| X\|_1$

因为对目标函数乘一个常系数不影响极值点的获得，所以可等价为优化问题

$\argmin_x \| X-B\|_2^2 + 2\lambda \| X\|_1$

此时的解为 $\lambda)$ 。

3. 软阈值(Soft Thresholding)的MATLAB代码

软阈值(Soft Thresholding)的函数代码可以写成专门针对问题

$\argmin_x \|X-B \|_2^2 + \lambda \| X\|_1$

软阈值(Soft Thresholding)是如此简单以至于可以用一句代码去实现它：

在这里插入图片描述

当然，也可写为另一种形式：

function [soft_thresh] = softthresholding(b, lambda)
	soft_thresh = sign(b).*max(abs(b) - lambda/2, 0);
end

python 代码：

# Soft Thresholding
def softthresholding(b, lam):
    soft_thresh = sign(b) * max(abs(b) - lam//2, 0)
    return soft_thresh

一定要注意：这种写法是针对最开始的优化问题：

$\argmin_x \|X -B \|_2^2 + \lambda \| X\|_1$

只需调用 softthresholding( $\frac{\lambda}{2}$ ) 即可。

若要解决优化问题

$\argmin_x \|X -B \|_2^2 / 2+ \lambda \| X\|_1$

只需调用 softthresholding( $\lambda$ ) 即可。

4. 软阈值(Soft Thresholding)测试代码

用以下一小段代码测试软阈值，用来求解优化问题：

$\argmin_x \|X -B \|_2^2 / 2+ \lambda \| X\|_1$

这里用的对比函数是基追踪降噪 (BPDN_quadprog.m)，参见压缩感知重构算法之基追踪降噪，使用 BPDN 时，实际上就是观测矩阵为单位阵时的一种特殊情况：

clear all;close all;clc; 
b = [-0.8487   -0.3349    0.5528    1.0391   -1.1176]';
lambda = 1;
x1=soft(b,lambda)
x2=BPDN_quadprog(b,eye(length(b)),lambda)
fprintf('\nError between soft and BPDN = %f\n',norm(x1-x2))

这里就不给出输出结果了。运行后，观察输出结果可知，soft函数与BPDN_quadprog函数的输结果相同。

另外，可以在matlab里输入以下命令看一个软阈值的图像：

x=-5:0.1:5;T=1;y=soft(x,T);plot(x,y);grid;

在这里插入图片描述

蓝子娃娃

关注

13
点赞
踩
54

收藏

觉得还不错? 一键收藏
0
评论
软阈值(Soft Thresholding)函数

1. 软阈值(Soft Thresholding)函数的作用软阈值(Soft Thresholding)可以求解如下优化问题： arg min⁡x∥X−B∥22+λ∥x∥1\argmin_x \| X - B\|_2^2 + \lambda\| x\|_1xargmin∥X−B∥22+λ∥x∥1 其中： X=[x1,x2,…,xN]TX = [x_1, x_2, \dots, x_N]^TX=[x1,x2,…,xN]T B=[b1,b2,…,bN]
复制链接

扫一扫