Masked Autoencoders Are Scalable Vision Learners——有遮挡的自编码器是一个可拓展的视觉学习器

最新推荐文章于 2024-07-09 10:33:20 发布

LustZero

最新推荐文章于 2024-07-09 10:33:20 发布

阅读量367

点赞数 8

文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55309250/article/details/134512616

版权

本文介绍了如何将maskedautoencoding从自然语言处理领域引入计算机视觉，通过改进模型结构，特别强调了预训练解码器在下游任务中的性能。研究者构建了一个包含编码器和解码器的网络，利用随机mask和L1Loss进行训练，目标是开发一个强大的图像特征提取器，适用于迁移学习任务。

摘要由CSDN通过智能技术生成

作者：

一作何凯明，陈鑫磊

文章整体框架：

1.引言：通过比较masked autoencoding在NLP上和CV上的应用的不同，引出文章改进的方法，使masked autoencoding在CV领域上应用，并使说明了模型的效果，重点是预训练的解码器在下游任务上的效果。

2.相关工作：带掩码自回归的语言模型，自编码器，带掩码的图像编码器的研究

3.模型架构

4.实验部分，包括微调和迁移学习

5.讨论与总结

MAE的网络架构：

网络分为编码器和解码器两部分，首先mask掉图片上一定比例的块，将保留的块投入编码器中，编码器提取未被mask掉的块的特征，提取出的特征和之前mask掉的块一起解码器中，最后复原出原本的图像。

训练过程：将图片投入网络中，随机mask一定比例，经过编码器解码器，将获得的图像与原始图像进行一个L1Loss，进行反向传播梯度更新。

这个MAE架构主要是为了训练出一个善于提取图像特征的编码器，用于迁移学习。

关注

8
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

LustZero CSDN认证博客专家 CSDN认证企业博客

码龄4年

5: 原创

153万+: 周排名

29万+: 总排名

2268: 访问

: 等级

113: 积分

30: 粉丝

39: 获赞

4: 评论

33: 收藏

私信

关注

热门文章

分类专栏

最新评论

Masked Autoencoders Are Scalable Vision Learners——有遮挡的自编码器是一个可拓展的视觉学习器
CSDN-Ada助手: 恭喜你写了这篇关于遮挡自编码器的博客！看来你对视觉学习器有着深入的了解。我很期待看到你未来更多关于可拓展视觉学习器的研究成果。或许下一步你可以探讨一下遮挡自编码器在特定视觉任务上的应用，这可能会给读者带来更多启发。希望你可以继续保持创作的热情，为我们带来更多精彩的内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
matplotlib.pyplot.imshow（）中 vmin, vmax 参数
CSDN-Ada助手: 恭喜您写了第四篇博客！标题为“matplotlib.pyplot.imshow（）中 vmin, vmax 参数”，这是一个非常有意义的主题。您对这两个参数的解释非常清晰，让读者能够更好地理解它们在imshow函数中的作用。非常感谢您的分享！在下一篇博客中，如果可能的话，您可以考虑探讨一下imshow函数中其他常用的参数，或者给出一些实际应用的示例。这样可以进一步帮助读者更好地使用这个函数，并丰富他们的知识。期待您的下一篇作品，再次恭喜您！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
训练时，loss的相关问题
CSDN-Ada助手: 非常感谢您对训练时loss相关问题的探讨，这篇博客非常有价值！您的持续创作不仅展示了您对于该主题的深入理解，也为读者提供了宝贵的参考。在下一步的创作中，或许您可以探讨一些解决这些loss相关问题的实用方法或者分享一些个人经验，这将进一步丰富您的内容，并助于我们更好地理解和应用这些概念。期待您未来更多精彩的博客！
Self-conditioned Image Generation via Generating Representations
CSDN-Ada助手: "非常棒的文章！鼓励作者继续创作，分享更多关于自我条件图像生成的研究成果。除了文章中提到的内容，还可以进一步探讨生成对抗网络（GAN）在图像生成中的应用，以及如何通过对抗训练来提高生成图像的质量和多样性。期待作者在未来的文章中能够分享更多相关的知识和技能，共同学习进步。" 如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
转置卷积的使用
CSDN-Ada助手: 恭喜你开始了博客创作，转置卷积的使用是一个很有深度的话题，你写得很好！接下来，我建议你可以尝试写一些实际案例或者应用场景，让读者更好地理解转置卷积的使用方法。希望你能继续保持创作的热情，期待看到更多精彩的内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。