MAE(Masked Autoencoders) 详解

sjx_alo

已于 2023-06-06 11:41:47 修改

阅读量8.9k

点赞数 18

分类专栏：机器视觉深度学习文章标签：计算机视觉人工智能深度学习 transformer

于 2023-06-01 17:05:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36758270/article/details/130977990

版权

深度学习同时被 2 个专栏收录

110 篇文章 ¥199.90 ¥299.90

订阅专栏

超级会员免费看

57 篇文章

订阅专栏

MAE（Masked Autoencoders）是一种用于计算机视觉的预训练方法，通过随机mask图像部分并重构来学习表示。该模型采用非对称的编码器-解码器结构，其中编码器仅处理未被mask的patches，解码器负责重建被mask的部分。在ImageNet-1K上，MAE取得了87.8%的准确性，且其简单设计和高效性使其在大规模视觉学习中表现出色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MAE详解

0. 引言
1. 网络结构
2. 关键问题解答
3. 总结

0. 引言

masked autoencoders (MAE) 是用于CV的自监督学习方法，优点是扩展性强的（scalable），方法简单。在MAE方法中会随机mask输入图片的部分patches，然后重构这些缺失的像素。MAE基于两个核心设计：（1）不对称的（asymmetric）编码解码结构，编码器仅仅对可见的patches进行编码，不对mask tokens进行任何处理，解码器将编码器的输出（latent representation）和mask tokens作为输入，重构image；（2）使用较高的mask比例（如75%）。MAE展现了很强的迁移性能，在ImageNet-1K上取得了best accuracy（87.8%），且因为方法简单，可扩展性极强（scalable）。
下图展示了MAE在ImageNet验证集上的重建结果。对于每个三元组，左边的图像是被遮挡的，中间的图像是MAE重建的

了解本专栏

超级会员免费看

博客等级

码龄9年

人工智能领域优质创作者

博客专家认证

188
原创

1941
点赞

2292
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: DeiT详解：知识蒸馏的Transformer

下一篇：: DiffRate详解：高效Vision Transformers的可微压缩率

最新评论

EEG+EMG学习系列 (1) :一个基于小波的自动睡眠评分模型
sjx_alo: 没有源码链接说明作者没公开源码。数据集的话你要看论文里面是不是公开数据集。如果不是的话就没有。
EEG+EMG学习系列 (1) :一个基于小波的自动睡眠评分模型
Icant_: 有源码和数据集吗
运动想象 (MI) 迁移学习系列 (15) : 基于Wasserstein距离的改进域适应网络
sjx_alo: 首先，要说这篇文章是基于EEG数据设计的一种模型，而不是单纯的提出一种新的模型。模型要基于EEG数据进行更加具体的设计，这也是文章的点。其次，对于ADDA模型和本模型相比，两者的整体思路大致是一致的（当然，所有GAN模型的本质差不多都是一致的）。至于，涉及具体源域和目标域的计算方式还是存在区别的。最后，关于WGAN模型和本文中的模型相比，还是模型在具体应用的区别。看关于目标函数的设计，近似是一致的。至于具体的EEG数据的应用的话，还是有区别的。起码，别的关于EEG数据的模型没有这么用的。
运动想象 (MI) 迁移学习系列 (15) : 基于Wasserstein距离的改进域适应网络
m0_48336876: 和Adversarial Discriminative Domain Adaptation（ADDA）这个有差别吗？WGAN就是基于Wasserstein的，不是已经提出了吗？
脑机接口：运动想象简介
幼儿园的高财生: 嗯嗯好，谢谢您

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

sjx_alo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。