实验失败：利用MAE做生成对抗式超分实验失败记录

原创已于 2024-04-18 11:20:24 修改 · 776 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #计算机视觉

于 2023-04-02 21:29:49 首次发布

深度学习专栏收录该内容

13 篇文章

订阅专栏

文章介绍了使用MAE（MaskedAutoencoders）进行图像分类的任务和预训练过程，包括图像的随机掩码、编码解码过程。作者提出疑问，是否可以结合生成对抗网络实现图像超分辨率，并计划逐步更新实验进展和代码。

一、想法构思

当时，看到MAE论文的时候，我就想能不能用MAE+生成对抗网络实现图像的超分？！所以有了这个实验。

下面先介绍MAE干了什么。MAE做的是图像分类的任务(但不只用于图像分类，对其他下游任务都具有很好的泛化性，这篇论文只是以图像分类任务为例子)，MAE有两个过程，一个是预训练的过程，一个是细化微调的过程：

预训练：将一幅输入图像进行随机掩码，接着将未掩码的图像块进行编码(encoder)，将encoder的输出结果与之前掩码的图像块进行拼接(拼接的位置要与原输入图像的各个图像块位置相同)，最后将拼接的结果输入decoder，decoder输出相同的维度，进行原图像的重建。如下图所示：
细化微调：将预训练好的encoder进行保留，去掉预训练的decoder，设计一个新的decoder用于做图像分类，然后接着去训练，最后实现图像分类。

看到这可能会有人疑惑，那为什么要做预训练进行图像的重构呢？不直接进行图像分类任务呢？简单地说，对与一幅掩码75%的图像，预训练网络能大致的还原出原图像，说明了这个网络很好的学习到了这幅图像的语义信息，比如，把一幅狗的图像掩盖75%，网络能大致还原狗的轮廓，说明这个网络学习到了这个“狗”这个含义，那么再去利用这个网络做图像分类，它就能很好的分类"狗"这个类别，对于其他类别也是一样的效果。

未完待续！有时间会不时慢慢更新，不断编辑，一步步放出代码！可能有点长！

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。