网络前置任务（Pretext task）和下游任务（downstream tasks）

不当菜鸡的程序媛

已于 2023-11-09 11:41:09 修改

阅读量1.5k

点赞数 2

文章标签：计算机视觉

于 2023-11-09 11:40:06 首次发布

参考：https://www.cnblogs.com/BlairGrowing/p/15023137.html

Pretext task 可以理解为是一种为达到特定训练任务而设计的间接任务。
　　比如，要训练一个网络来对 ImageNet 分类，可以表达为 fθ(x):x→yfθ(x):x→y ，目的是获得具有语义特征提取/推理能力的 θθ 。假设有另外一个任务 (Pretext task )，可以近似获得 θθ。比如， Auto−encoderAuto−encoder (AEAE) , 表示为： gθ(x):x→xgθ(x):x→x 。为什么 AEAE 可以近似 θθ 呢? 因为 AE 要重建 xx 就必须学习 xx 中的内在关系，而这种内在关系的学习又是有利于我们学习 fθ(x)fθ(x) 的。这种方式也叫做预训练，为了在目标任务上获得更好的泛化能力，一般还需要进行 fine−tuningfine−tuning 等操作。
　　因此，Pretex task 的好处就是简化了原任务的求解，在深度学习里就是避免了人工标记样本，实现无监督的语义提取。
　　Pretext任务可以进一步理解为：对目标任务有帮助的辅助任务。这种任务目前更多用于 Self-Supervised learning，即一种更加宽泛的无监督学习。以往训练深度学习需要大量的人工标注的样本，这是费时耗力的，而自监督的提出就是为了打破这种人工标注样本的限制，目的是在没有人工标注的条件下也能高效的训练网络，自监督的核心问题是如何产生伪标签（Pseudo label），而这种伪标签的产生是不涉及人工的，比如上述的 AE 的伪标签就是自身。这里举几个在视觉任务里常用的 pretext task 伪标签的产生方式：

Rotation（图片旋转）

Colorization（图片上色）

Inpainting（图片补全)

Jigsaw Puzzle/Context Prediction（关系预测/上下文预测）

不当菜鸡的程序媛

博客等级

码龄8年

357
原创

1375
点赞

1541
收藏

1296
粉丝

关注

私信

分类专栏

最新评论

论文阅读Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Con
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读Continuous, Subject-Specific Attribute Control in T2I Models by Identifying Semantic Directions
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读HARIVO: Harnessing Text-to-Image Models for Video Generation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读Discovering Interpretable Directions in the Semantic Latent Space of Diffusion Models
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读PreciseControl: Enhancing Text-To-Image Diffusion Models with Fine-Grained Attribute Control
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

2025

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。