极简笔记 Multi-task Self-Supervised Visual Learning

最新推荐文章于 2024-07-25 23:48:49 发布

Hibercraft

最新推荐文章于 2024-07-25 23:48:49 发布

阅读量4.1k

点赞数

分类专栏：极简笔记

本文链接：https://blog.csdn.net/Hibercraft/article/details/80150148

版权

本文探讨了使用自监督任务对模型进行预训练，然后迁移至相关任务进行微调的方法。研究发现深层网络在自监督任务中表现更好，多任务预训练在高语义任务上的性能优于单任务，而在低语义任务上可能不如ImageNet预训练模型。此外，自监督任务结合可能加速网络训练，但某些优化方法如输入和谐化和权重约束效果有限。文章提出了一种多任务网络结构，并指出自监督预训练模型在特定任务上可能优于ImageNet预训练模型。

摘要由CSDN通过智能技术生成

极简笔记 Multi-task Self-Supervised Visual Learning

论文地址: https://arxiv.org/abs/1708.07860

文章核心是利用自监督的任务对模型进行pretrain，再将得到的模型迁移到相关任务进行finetuning（这时候对不更新骨架网络参数，来进行对比，只学习不同任务的head），期望得到的性能接近带有额外label的pretrain模型。

文章提到了多种自监督任务，这些任务的标注可以直接得到而不用额外标注：1. relative position，即随机切两块patch送给网络，回归之间的相对位置；2. 单通道图像上色；3. 生成伪类；4. 针对视频预测哪些像素将会发生移动

文章主要发现为：1. 深层网络比浅层网络在self-supervised任务上更加work；2. multi-task self-supervised在语义要求高的任务上得到的性能比单任务高，但是在语义要求低的任务（比如深度预测），单任务性能甚至超过ImageNet pretrain model；3. ImageNet pretrained model和multi-task self-supervised预训练模型的性能在不同benchmark上会有不同，但比较接近（当然ImageNet pretrain是作为实验性能上限啦）；4. 在self-supervise task中对输入进行和谐化处理和对weight进行Lasso约束，没有太大性能提升；5. 结合自监督任务能够

最低0.47元/天解锁文章

Hibercraft

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
极简笔记 Multi-task Self-Supervised Visual Learning

极简笔记 Multi-task Self-Supervised Visual Learning论文地址: https://arxiv.org/abs/1708.07860文章核心是利用自监督的任务对模型进行pretrain，再将得到的模型迁移到相关任务进行finetuning（这时候对不更新骨架网络参数，来进行对比，只学习不同任务的head），期望得到的性能接近带有额外label的pret...
复制链接

扫一扫