如何理解伪标签中的置信度

最新推荐文章于 2025-03-19 21:53:38 发布

暗巷提灯

最新推荐文章于 2025-03-19 21:53:38 发布

阅读量1.4k

点赞数 12

文章标签：人工智能

本文链接：https://blog.csdn.net/m0_75015083/article/details/135758290

版权

伪标签中常常有置信度这一说法，通过置信度，我们可以筛选出质量高的伪标签（直观来说是像素），那比如说预测结果为一个2×256×256的概率图，那针对一个像素的两个通道值，怎样才算质量高或者低呢？

answer：

预测结果是一个 2×256×256 的概率图，其中两个通道代表的是对应像素为某两个类别的概率。如果采用置信度过滤器，并且设置阈值为 0.9，那么对于每个像素，您会检查这两个通道的概率值。

通常，在二分类问题中（比如变化检测，类别可以是变化/未变化），两个通道的概率值是互补的，即一个通道的概率值越高，另一个通道的值就越低。因此，通常只有一个通道的概率值会接近或超过置信度阈值。

在案例中：

如果一个像素的两个通道的概率值都小于 0.9，这意味着模型对于这个像素属于任一类别都不够自信。
如果至少有一个通道的概率值大于或等于 0.9，这意味着模型对于这个像素属于相应类别有较高的自信。

因此，在应用置信度过滤器时：

如果希望保证高置信度的决策，应该只保留那些至少有一个通道概率值大于或等于 0.9 的像素作为高质量的标签。
对于那些两个通道的概率值都小于 0.9 的像素，可以认为模型对这些像素的分类不够自信，因此可以将这些像素的标签视为低质量，并在损失函数计算中排除它们。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

暗巷提灯

关注关注

12
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

半监督学习之伪标签(pseudo label,entropy minimization,self-training)

一只禾的博客

02-02

1万+

1.什么是伪标签 伪标签方法是一种同时从未标记数据和标记数据中学习的监督范式。将具有最大预测概率的类作为伪标签。形式化后等价于熵正则化（Entropy Regularization)或熵最小化（Entropy Minimization). 根据半监督学习的假设，决策边界应该尽可能通过数据较为稀疏的区域，即低密度区域，从而避免把密集的样本数据点分到决策边界的两侧，也就是说模型需要对未标记数据做出低熵预测，即熵最小化。伪标签方法是有利于熵最小化的，即伪标签的目标其实就是熵最小化。 Loss function分为

伪标签

junjian Li

05-19

2386

什么是伪标签 伪标签是将置信度较高的测试数据添加到训练数据中的过程。伪标签一共有5个步骤。使用**训练集数据(Train1）**训练一个模型。使用训练好的模型预测测试集数据。将预测的置信度较高的样本加入到训练集中。使用新的训练集训练一个新的模型。使用新的模型去预测测试集数据。 1. 建立第一个模型正常建立模型即可 2. 预测测试集正常测试即可 3. 增加伪标签数据到训练集将所有预测的置信度Pr(y=1|x)>0.99和Pr(y=0|x)>0.99的加入到训练集中。 4.训练一

参与评论您还未登录，请先登录后发表或查看评论

半监督学习中的伪标签（Pseudo-Labelling）

weixin_44438120的博客

09-25

6880

最近在做东西过程中接触到了半监督学习，所以以此篇博客记录个人觉得写的很好的一篇博客，以防遗忘。如若侵权请联系删除。什么是伪标签技术 伪标签的定义来自于半监督学习，半监督学习的核心思想是通过借助无标签的数据来提升有监督过程中的模型性能。举个简单的半监督学习例子，我想去训练一个通过胸片图像来诊断是否患有乳腺癌的模型，但是专家标注一张胸片图像要收费，于是我掏空自己的钱包让专家帮我标注了10张胸片，可是我这10张图片又要划分训练集测试集，咋训练看着都要过拟合哇，这可咋办？聪明的我问了问专家，说不标注的胸片要钱

结合基于标签置信度的特征选择方法用于部分多标签学习-简介版

最新发布

qq_52810166的博客

03-19

1037

1. **LCFS-PML 能够有效去除伪正标签，提高分类性能。** 2. **采用特征-标签交替优化策略，使特征子空间和标签置信度相互提升。** 3. **实验表明该方法优于已有 PML 方法，特别适用于高维数据和噪声标签数据。** 4. **计算复杂度较合理，收敛速度较快，适用于大规模数据集。**

伪标签还能这样用？半监督力作UPS（ICLR 2021）大揭秘！

阿木寺的博客

02-19

2352

点击上方“CVer”，选择加"星标"置顶重磅干货，第一时间送达本文作者：罗驳思 | 来源：知乎（已授权）https://zhuanlan.zhihu.com/p/3507...

伪标签技术

qq_45812502的博客

10-11

453

伪标签

request.post 200无数据_伪标签：充分利用无标注数据信息

weixin_39768645的博客

12-11

335

今天来个比较简单文章，放松一下。我的两个NLP文章讲解仓库一个1.2k star，一个700star了，感兴趣的后台回复【仓库】获取地址哈。今天分享的论文是 Pseudo-Label[1]，是个比较早的论文了，属于半监督里的一个入门思想。主要是解决三个知识点：什么是伪标签怎么使用伪标签伪标签为啥有用伪标签先说第一个问题，假设我们现在有一个文本分类模型(先不用管分类模型是怎么来的以及怎么训...

基于伪标签置信选择的半监督医疗事件抽取.docx

07-03

### 基于伪标签置信选择的半监督医疗事件抽取 #### 一、引言与背景在信息抽取领域，事件抽取（Event Extraction, EE）是一项关键的技术，旨在从文本中自动识别出特定类型的事件及其相关的参与者。医疗事件抽取...

统一伪损失置信度提升半监督少样本学习性能

PLCM通过分析伪标记数据在伪损失分布中的位置，来确定它们的置信度。这意味着高伪损失值的数据被认为不确定性较高，而低伪损失值的数据则被认为是更可靠的。这种方法有助于筛选出高质量的伪标记数据，增强分类器的...

在半监督学习中，ConMatch框架如何使用一致性正则化和置信度生成伪标签？请详细说明该框架的原理和实现步骤。

10-30

该框架不仅包括了非参数和参数两种计算置信度的方法，还特别设计了在训练过程中学习伪标签置信度的机制，实现了端到端的训练。分阶段训练策略的应用进一步保证了模型在半监督学习过程中的稳定性和性能。实现...

ConMatch框架是如何结合一致性正则化和置信度来生成伪标签的？请具体阐述其原理及实现步骤。

10-30

ConMatch框架提出了一种新颖的置信度衡量机制，该机制结合了一致性正则化原理，以优化半监督学习中的伪标签生成。在半监督学习中，如何有效利用未标记数据是一个关键问题，而ConMatch针对这一问题提出了解决方案，...

基于伪label的一类无监督特征选择方法

有致园

10-24

4923

本文介绍无监督特征选择方法的一种解决思路。

计算置信度

MaYingColdPlay的博客

05-06

371

https://jingyan.baidu.com/article/f3ad7d0fdb853148c2345b0e.html

深度学习中的预测图片中的矩形框、标签、置信度分别是什么意思。

weixin_43501408的博客

12-16

1401

例如，对于一张图像中的目标检测任务，模型可能输出多个目标框，每个框都伴随一个置信度分数。如果某个框的置信度分数很高，那么模型认为在该位置存在对应类别的目标的可能性较大；反之，如果置信度分数较低，模型可能对该预测结果的准确性不太确信。在处理多个目标或多个类别的情况下，置信度分数也可以用来筛选或排除低置信度的预测结果，以提高模型的准确性。总的来说，置信度是深度学习模型提供的一种度量，用于衡量模型对其预测结果的信心水平。表示模型对该预测结果的信心程度，通常是一个在 0 到 1 之间的概率值。

ECCV2022 - ConMatch：置信度引导的半监督学习

点亮创新之光，照亮科研梦想

01-11

1952

我们提出了一种新的半监督学习框架，智能地利用模型预测之间的一致性正则化，从图像的两个强增强视图，由伪标签置信度加权，称为ConMatch。虽然最新的半监督学习方法使用图像的弱增强视图和强增强视图来定义方向一致性损失，但如何为两个强增强视图之间的一致性正则化定义这种方向仍未探索。为了解释这一点，我们提出了新的伪标签置信度测量方法，通过弱增强视图作为非参数和参数方法的锚。特别是在参数化方法中，我们首次提出了在网络中学习伪标签置信度的方法，这是通过骨干网模型端到端学习的。

GNN中如何利用置信度和不确定性做文章

一个nlp探险者的博客

12-01

2029

0. 引言目前图神经网络存在很多的问题，这里作者提出了两个，一个是过平滑，另外一个是对预测结果的不确定性进行评估，换句话说希望预测的结果不仅仅是一个结果，如果有一个置信度就更好了，比如疾病预测，预测了影像目前是什么病，有一个置信度是不是会更有价值一些呢？之前很少有人探讨过GCN背景下的置信度估计，这篇博客将看看仅这些工作是如何做的？ 1. Confidence-based Graph Convolutional Networks for Semi-Supervised Learning（AISTATS

西瓜书之模型评估与选择（笔记一）

weixin_42966093的博客

11-28

1436

一些概念 P类问题——所有复杂度为多项式时间的问题集合 NP类问题——可以在多项式时间内验证一个解是否正确的问题评估方法数据要分为训练集和测试集（注意在划分训练集和测试集的时候，要保持数据分布的一致性），有三种方法： 1.留出法 2.交叉验证法 3.自助法 ...