Self-training在目标检测任务上的实践

最新推荐文章于 2023-08-30 09:06:11 发布

VIP文章 PaperWeekly

最新推荐文章于 2023-08-30 09:06:11 发布

阅读量1.5k

点赞数 2

文章标签：计算机视觉机器学习人工智能深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/107724051

版权

©PaperWeekly 原创 · 作者｜燕皖

单位｜渊亭科技

研究方向｜计算机视觉、CNN

在监督学习中，模型都是需要有一个大量的有标签的数据集进行拟合，通常数据成本、人力成本都很高。而现实生活中，无标签的样本的收集相对就很容易很多。因此，近年来，利用大量的无标签样本和少量的有标签样本的半监督学习备受关注。

本文主要介绍一种半监督的方法——Self-training，其主要思路是：先利用有标签数据训练得到模型，然后对无标签数据进行预测，置信度高的数据可以用于加入训练集，继续训练，直到模型符合要求。首先介绍了两种经典的 Self-training 方法，然后介绍了 Self-training 在 Kaggle 比赛上的实践。

Pseudo-label

论文标题：The Simple and EfficientSemi-Supervised Learning Method for Deep Neural Networks

论文来源：ICML 2013

论文链接：http://deeplearning.net/wp-content/uploads/2013/03/pseudo_label_final.pdf

代码链接：https://github.com/iBelieveCJM/pseudo_label-pytorch

1.1 训练策略

Pseudo-label 是 2013 年提出的一个非常简单有效的Semi-Supervised Learning 方法，其主要思想是在一批有标签和无标签的图像上，同时训练一个模型。训练流程如下：

Step 1：首先，同时使用有标记和未标记的 data，以有监督的方式训练 pretrained model。总损失是有标记和无标记损失项的加权和，前面是有标签数据的损失部分，后面的无标签数据的损失部分，如下：

其中，y 代表已标记数据的标签，y′ 代表了未标记数据的伪标签。

通常，为了确保模型已经从标记的数据中学习了足够多的信息，alpha_t 在最初的 N epoch 中，设置为 0，然后逐渐增加到 M epoch 后保持不变。如下式：

最低0.47元/天解锁文章

关注

2
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
Self-training在目标检测任务上的实践

©PaperWeekly 原创 ·作者｜燕皖单位｜渊亭科技研究方向｜计算机视觉、CNN在监督学习中，模型都是需要有一个大量的有标签的数据集进行拟合，通常数据成本、人力成本都很高。而现实...
复制链接

扫一扫

PaperWeekly CSDN认证博客专家 CSDN认证企业博客

码龄7年

1385: 原创

5595: 周排名

157: 总排名

510万+: 访问

: 等级

4万+: 积分

7785: 粉丝

5301: 获赞

976: 评论

2万+: 收藏

私信

关注

热门文章

最新评论

强化学习中的调参经验与编程技巧（on policy篇）
weixin_50778551: 请问安装好了吗
ICLR 2024 | 微软提出全新LLM剪枝方法：参数减少25%，大幅提升计算效率
qq_42944558: 和sparsegpt对比实验结论错了。sparsity 2:4 是指4个数为一组，删去其中两个，稀疏比例是50%呢
文末送书 | 中山大学HCP实验室专著《多模态大模型》重磅发布
风灵月影宗大师兄: 大佬的文章让我对这领域的技术问题有了更深入的了解，尤其是大佬提到的那些“坑点”，我相信能够在实际应用中避免或解决很多问题。谢谢大佬的分享，期待大佬的更多精彩文章，让我们共同学习、进步
文末送书 | 中山大学HCP实验室专著《多模态大模型》重磅发布
风灵月影宗大师兄: 大佬的文章让我对这领域的技术问题有了更深入的了解，尤其是大佬提到的那些“坑点”，我相信能够在实际应用中避免或解决很多问题。谢谢大佬的分享，期待大佬的更多精彩文章，让我们共同学习、进步
文末送书 | 中山大学HCP实验室专著《多模态大模型》重磅发布
风灵月影宗大师兄: 大佬的文章让我对这领域的技术问题有了更深入的了解，尤其是大佬提到的那些“坑点”，我相信能够在实际应用中避免或解决很多问题。谢谢大佬的分享，期待大佬的更多精彩文章，让我们共同学习、进步

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。