softmax

最新推荐文章于 2024-07-31 15:02:43 发布

UCAS_V

最新推荐文章于 2024-07-31 15:02:43 发布

阅读量101

点赞数

分类专栏：深度学习文章标签： python 机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22815083/article/details/131170853

版权

深度学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

文章介绍了softmax函数在转换向量为概率分布中的应用，特别是在CLIP模型中用于图像和文本相似度的表示。同时，提到了余弦相似度作为另一种计算向量相似度的方法。此外，对比损失和交叉熵损失在模型训练中的作用也被讨论，前者用于无监督学习中的对比学习，后者常用于监督学习中的分类问题。

摘要由CSDN通过智能技术生成

softmax函数的公式如下：

$softmax(z_i) = \frac{e^{z_i/T}}{\sum\limits_{j=1}^K e^{z_j/T}}$

其中， $z_i$ 是输入向量的第 $i$ 个元素， $T$ 是温度参数， $K$ 是向量的长度。 $softmax(z_i)$ 表示将向量 $z$ 转化为概率分布的第 $i$ 个元素的概率，其中 $\in [1, K]$ 。在CLIP中，我们可以将 $z_i$ 理解为图像和文本之间的相似度， $T$ 的值是由网络学习得到的，用于调整相似度的度量。

用于计算相似度的余弦相似度公式：
$\frac{x\cdot y}{|x| \times |y|}$

其中， $x$ 和 $y$ 分别表示两个向量， $\cdot$ 表示向量的点积， $∣ x ∣$ 和 $∣ y ∣$ 表示向量的模长。

用于计算 softmax 函数的公式：
$softmax(z_i) = \frac{e^{z_i/T}}{\sum\limits_{j=1}^K e^{z_j/T}}$

其中， $z_i$ 是输入向量的第 $i$ 个元素， $T$ 是温度参数， $K$ 是向量的长度。

用于计算对比损失的公式：
$\mathcal{L}_{\text{contrastive}}(v, u, \tau) = -\log\frac{e^{\frac{v\cdot u}{\tau}}}{\sum_j e^{\frac{v\cdot u_j}{\tau}}}$

其中， $v$ 和 $u$ 分别表示图像和文本的嵌入向量， $u_j$ 是负样本的文本向量， $\tau$ 是温度参数。

用于计算交叉熵损失的公式：
$\mathcal{L}_{\text{cross-entropy}}(y, p) = -\sum_i y_i \log p_i$

其中， $y$ 是真实标签的向量， $p$ 是模型预测的概率分布向量。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
softmax

的值是由网络学习得到的，用于调整相似度的度量。理解为图像和文本之间的相似度，分别表示图像和文本的嵌入向量，在CLIP中，我们可以将。是模型预测的概率分布向量。是负样本的文本向量，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UCAS_V 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。