Gaussian Mixture Loss

最新推荐文章于 2024-08-28 09:09:13 发布

叫什么就是什么

最新推荐文章于 2024-08-28 09:09:13 发布

阅读量3.1k

点赞数 1

分类专栏： deeplearning 文章标签： Gaussian Mixture Loss deep learning

本文链接：https://blog.csdn.net/qq_24548569/article/details/89739412

版权

本文探讨了深度学习中的一种损失函数——高斯混合损失（Gaussian Mixture Loss），它通过假设特征服从高斯混合分布来提高特征的类内紧凑性和类间可分离性。文章详细介绍了大型边距GM损失（Large-Margin GM Loss）以及其与center loss的关系，并展示了在实际应用中的效果。

摘要由CSDN通过智能技术生成

Gaussian Mixture Loss

前言

该论文思考了深度神经网络提取的特征与类别之间的关系，假设学习到的特征服从高斯混合分布，提出了高斯混合损失函数，同时提高了特征的类内紧凑性和类间可分离性（intra-class compactness and inter-class separability）。

Gaussian Mixture Loss ¹

假设：特征服从高斯混合分布。
有K个类别，每个类别出现的概率为 $p (k)$ ，类别k出现特征x的概率是 $p (x ∣ k)$ ，则特征x的概率为
$\sum_{k=1}^{K} p(x|k) p(k)$
假设概率 $p (x ∣ k)$ 服从正态分布， $\mu_k$ 为均值， $\Sigma_k$ 为协方差矩阵，则
$\sum_{k=1}^{K} \mathcal{N} (x; \mu_k, \Sigma_k) p(k)$
特征x对应的类别为 $\in [1, K]$ ，特征x属于类别z的后验概率为
$\frac{p(x|z)p(z)}{\sum_{k=1}^{K}p(x|k)p(k)} = \frac{\mathcal{N} (x; \mu_z, \Sigma_z) p(z)}{\sum_{k=1}^{K} \mathcal{N} (x; \mu_k, \Sigma_k) p(k)}$
从这个公式，我们可以得到结论：x越靠近类别中心 $\mu_{z}$ ， $p (z ∣ x)$ 的值就越大。

因此，分类损失函数为
$\mathcal{L}_{cls} = - \frac{1}{N} \sum_{i=1}^{N} \log \frac{\mathcal{N}(x_i; \mu_{z_i}, \Sigma_{z_i})p(z_i)}{\sum_{k-1}^{K} \mathcal{N}(x_i; \mu_{k}, \Sigma_{k})p(z_i)}$

单单优化上面的分类损失不能使提取出来的训练特征趋向于高斯混合分布。例如，一个特征 $x_i$ 可以原理对应类别的中心 $\mu_{z_i}$ ，同时可以被正确分类，只要特征 $x_i$ 相对于其他类别中心更靠近 $\mu_{z_i}$ 。为了解决这个问题，作者添加了一个似然正则化项（likelihood regularization term）
$p(X,Z|\mu, \Sigma) = \prod_{i=1}^{N} \mathcal{N}(x_i; \mu_{z_i}, \Sigma_{z_i})p(z_i)$