机器学习中的数学——距离定义（二十五）：布雷格曼散度（Bregman Divergence）

von Neumann

于 2022-01-09 17:22:36 发布

阅读量1.5w

点赞数 16

分类专栏：机器学习中的数学文章标签：人工智能机器学习深度学习距离度量 Bregman散度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hy592070616/article/details/122395719

版权

机器学习中的数学专栏收录该内容

112 篇文章 758 订阅

订阅专栏

分类目录：《机器学习中的数学》总目录
相关文章：
· 距离定义：基础知识
· 距离定义（一）：欧几里得距离（Euclidean Distance）
· 距离定义（二）：曼哈顿距离（Manhattan Distance）
· 距离定义（三）：闵可夫斯基距离（Minkowski Distance）
· 距离定义（四）：切比雪夫距离（Chebyshev Distance）
· 距离定义（五）：标准化的欧几里得距离（Standardized Euclidean Distance）
· 距离定义（六）：马氏距离（Mahalanobis Distance）
· 距离定义（七）：兰氏距离（Lance and Williams Distance）/堪培拉距离（Canberra Distance）
· 距离定义（八）：余弦距离（Cosine Distance）
· 距离定义（九）：测地距离（Geodesic Distance）
· 距离定义（十）：布雷柯蒂斯距离（Bray Curtis Distance）
· 距离定义（十一）：汉明距离（Hamming Distance）
· 距离定义（十二）：编辑距离（Edit Distance，Levenshtein Distance）
· 距离定义（十三）：杰卡德距离（Jaccard Distance）和杰卡德相似系数（Jaccard Similarity Coefficient）
· 距离定义（十四）：Ochiia系数（Ochiia Coefficient）
· 距离定义（十五）：Dice系数（Dice Coefficient）
· 距离定义（十六）：豪斯多夫距离（Hausdorff Distance）
· 距离定义（十七）：皮尔逊相关系数（Pearson Correlation）
· 距离定义（十八）：卡方距离（Chi-square Measure）
· 距离定义（十九）：交叉熵（Cross Entropy）
· 距离定义（二十）：相对熵（Relative Entropy）/KL散度（Kullback-Leibler Divergence）
· 距离定义（二十一）：JS散度（Jensen–Shannon Divergence）
· 距离定义（二十二）：海林格距离（Hellinger Distance）
· 距离定义（二十三）：α-散度（α-Divergence）
· 距离定义（二十四）：F-散度（F-Divergence）
· 距离定义（二十五）：布雷格曼散度（Bregman Divergence）
· 距离定义（二十六）：Wasserstein距离（Wasserstei Distance）/EM距离（Earth-Mover Distance）
· 距离定义（二十七）：巴氏距离（Bhattacharyya Distance）
· 距离定义（二十八）：最大均值差异（Maximum Mean Discrepancy, MMD）
· 距离定义（二十九）：点间互信息（Pointwise Mutual Information, PMI）

F-散度已经可以表达我们提到的所有散度，目前为止它是最通用的散度形式。但很多文章也会出现另一种叫做Bregman的散度，它和F-散度不太一样，是另一大类散度。

我们以欧几里得距离举例，即 $n$ 维空间中的欧几里得距离：
$y)=\sqrt{\sum_{i=1}^n(x_i-y_i)^2}$

我们将其平方：
$d^2(x, y)=\sum_{i=1}^n(x_i-y_i)^2$

如果我们定义内积 $y>=\sum_{i-1}^nx_iy_i$ 和欧式模 $||x||=\sqrt{<x, x>}$ ，则上式可以写为如下形式：
$d^2(x, y)=\sum_{i=1}^n(x_i-y_i)^2=<x-y, x-y>=||x||^2-(||y||^2+<2y, x-y>)$

注意到， $2 y$ 是 $y^2$ 的导数，因此上式的后一项 $y||^2+<2y, x-y>$ 是函数 $f(z)=||z||^2$ 在 $y$ 点的切线在 $x$ 处的取值。所以均方欧几里得距离的几何描述便是欧式模函数在点 $x$ 和其在 $y$ 点切线在点估计的差。如下图绿线所示：

那么一个很自然的想法就是把这个定义拓展，即对任意 $R^n$ 的函数 $f (x)$ ，我们都可以定义：
$y)=f(x)-(f(y)+<\nabla f(y), x-y>)$

若 $f (x)$ 是凸函数，则可以保证 $y)\geq0$ ，上式也是Bregman散度（Bregman Divergence）的定义。

和F-散度类似，Bregman散度也是一大类散度的通用表达形式，具体的，根据 $f (x)$ 取不同的函数，它可以表示不同的散度，其中KL散度也是它的一个特例：

关注

16
点赞
踩
43

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习中的数学——距离定义（二十五）：布雷格曼散度（Bregman Divergence）

F-散度已经可以表达我们提到的所有散度，目前为止它是最通用的散度形式。但很多文章也会出现另一种叫做Bregman的散度，它和F-散度不太一样，是另一大类散度。我们以欧几里得距离举例，即nnn维空间中的欧几里得距离：d(x,y)=∑i=1n(xi−yi)2d(x, y)=\sqrt{\sum_{i=1}^n(x_i-y_i)^2}d(x,y)=i=1∑n(xi−yi)2我们将其平方：d2(x,y)=∑i=1n(xi−yi)2d^2(x, y)=\sum_{i=1}^n(x_i-y_i)^2d2
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

von Neumann 您的赞赏是我创作最大的动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。