【论文相关】“Active Domain Adaptation via Clustering Uncertainty-weighted Embeddings“

在这篇论文中,作者提出了一种基于模型熵来对深度嵌入进行加权的方法。具体来说,作者使用训练好的分类器来对目标域中的每个样本进行分类,并计算其分类结果的熵。熵值越高表示分类结果越不确定,因此作者认为这些嵌入位于特征空间的不确定区域。

接下来,作者使用熵值作为权重对嵌入进行加权,以强调特征空间中的不确定区域。具体地,对于每个目标域样本 x t x_t xt,它的嵌入 z t z_t zt将被乘以一个权重 w t w_t wt,其中权重由以下公式给出:

w t = 1 + α H ( y t ∣ x t ) w_t = 1 + \alpha H(y_t|x_t) wt=1+αH(ytxt)

其中, H ( y t ∣ x t ) H(y_t|x_t) H(ytxt)是分类器对样本 x t x_t xt的分类结果 y t y_t yt的熵, α \alpha α是超参数,用于调节加权的影响力。当 α = 0 \alpha=0 α=0时,加权不起作用,当 α > 0 \alpha>0 α>0时,加权将更加强调分类不确定性较高的样本。

计算分类结果的熵可以通过以下步骤进行:

对于一个样本,假设它被分类到 C C C 个类别中的第 i i i 个类别的概率为 p i p_i pi,则该样本的分类结果熵可以通过下面的公式计算:
H ( x ) = − ∑ i = 1 C p i log ⁡ 2 p i H(x) = -\sum_{i=1}^C p_i \log_2 p_i H(x)=i=1Cpilog2pi

其中 H ( x ) H(x) H(x) 表示该样本的分类结果熵。

对于一个模型在一个数据集上的分类结果熵,可以将数据集中所有样本的分类结果熵求平均得到,即:
H = 1 N ∑ i = 1 N H ( x i ) H = \frac{1}{N}\sum_{i=1}^N H(x_i) H=N1i=1NH(xi)

其中 N N N 表示数据集中样本的数量, x i x_i xi 表示第 i i i 个样本。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值