范数

牵着蜗牛去散步_

于 2018-08-28 15:10:28 发布

阅读量750

点赞数

分类专栏：深度学习文章标签：范数

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

范数

有时我们需要衡量一个向量的大小。在机器学习中，我们经常使用被称为范数（norm）的函数衡量向量大小。形式上， $L_p$ 范数定义如下:

∥ x ∥ p = (\sum i | x i | p) 1 p

$\parallel x\parallel_p = (\sum_i|{x_i}| ^p)^\frac{1}{p}$

其中 $p \in R， p ≥ 1$ 。
范数（包括 Lp 范数）是将向量映射到非负值的函数。直观上来说，向量 x 的范数衡量从原点到点 x 的距离。更严格地说，范数是满足下列性质的任意函数：
• $f(x) = 0 ) =>x = 0$
• $f(x + y) \leq f(x) + f(y)$ （三角不等式（triangle inequality））
• $\forallα \in\Bbb R, f(αx) =|α|f(x)$
当 p = 2 时， $L^2$ 范数被称为 欧几里得范数（Euclidean norm）。它表示从原点出发到向量 x 确定的点的欧几里得距离。 L2 范数在机器学习中出现地十分频繁，经常简化表示为 $∥x∥$ ，略去了下标 2。平方 $L^2$ 范数也经常用来衡量向量的大小，可以简单地通过点积 $\mathbf{x}^\mathsf{T}x$ 计算。平方 $L^2$ 范数在数学和计算上都比 $L^2$ 范数本身更方便。例如，平方 $L^2$ 范数对x 中每个元素的导数只取决于对应的元素，而 $L^2$ 范数对每个元素的导数却和整个向量相关。但是在很多情况下，平方 $L^2$ 范数也可能不受欢迎，因为它在原点附近增长得十分缓慢。在某些机器学习应用中，区分恰好是零的元素和非零但值很小的元素是很重要的。在这些情况下，我们转而使用在各个位置斜率相同，同时保持简单的数学形式的函数： $L^1$ 范数。 $L^1$ 范数可以简化如下：