深度学习|自监督学习、MAE学习策略、消融实验

最新推荐文章于 2024-03-29 10:17:57 发布

魔法自动机

最新推荐文章于 2024-03-29 10:17:57 发布

阅读量835

点赞数 2

分类专栏：人工智能文章标签：深度学习人工智能机器学习 MAE学习策略自监督学习消融实验

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40306845/article/details/132393754

版权

人工智能专栏收录该内容

18 篇文章 0 订阅

订阅专栏

前言：最近在阅读论文，发现太多机器学习的知识不懂，把最近看的一篇论文有关的知识点汇总了一下。

自监督学习、MAE学习策略、消融实验

自监督学习
MAE学习策略
消融实验

自监督学习

Pretrain-Finetune（预训练+精调）模式：迁移学习，通过在源域数据上学习知识，再迁移到下游其他目标任务上，提升目标任务上的效果。

Self-supervised Learning（自监督学习）：它的目标是更好地利用无监督数据，提升后续监督学习任务的效果。定义一个辅助任务，即从无监督的数据中，通过巧妙地设计自动构造出有监督（伪标签）数据，学习一个预训练模型。

好处：因为有标签的数据集很贵，需要很多人工去打标签，成本高。相反，无标签的数据网上到处都是，便宜。

思路：

第一阶段（in a task-agnostic way）：设计辅助任务（Pretext Tasks），用无标签数据将参数从没有训练到初步成型。
第二阶段（in a task-specific way）：根据下游任务（Downstream Tasks），去用带标签的数据集把参数训练到完全成型。

特点：第二阶段需要的数据集就不用太多了，因为参数经过第一阶段就训练的差不多，能够节省标记数据集。

MAE学习策略

MAE学习策略是自监督学习的一种。

Encoder-Decoder（编码器-解码器）：是深度学习模型的抽象概念，很多模型都是起源于这个架构，例如CNN。
编码器（Encoder）：负责将输入（Input）转化为特征（Feature）。
解码器（Decoder）：负责将特征（Feature）转化为目标（Target）。

Masked Autoencoders（MAE，掩码自编码器）：随机遮挡（Mask）输入图片部分，然后重建原来的图像。

思路：

数据：图像被分割成大小相同的patches，然后随机mask（遮挡）一部分patches。
Encoder：输入没有被mask的patches就行操作。
Decoder：输入Encoder处理后的patches和mask的patches就行重建图像。
调整：重建后的图像和原始图像作比较，然后调整模型参数。

特点：可以把训练好的Encoder部分结合别的Decoder使用，Encoder部分通过MAE学习策略能够从数据中提取有意义的特征。

消融实验

Ablation study（消融实验）：消融实验通常是指删除模型或算法的某些“功能”，并查看其如何影响性能。多个创新方法，或者新型结构模块，或注意力模块等在一起为模型的性能作出了贡献，为了了解每个部分单独能发挥的作用，常常会在论文中提出消融研究。通俗来说，就是控制变量法。

举例：例如某论文提出了方法A，B，C，而该论文是基于某个baseline的改进。因此，在消融实验时候，会进行baseline 、baseline+A、baseline+B、baseline+C、baseline+A+B+C等实验的各个评价指标有多少，从而得出每个部分所能发挥的作用有多大。

在论文表格中，通常会看到“w/o”和“w”，其实指的是消融实验。“w/o”是without的缩写，而“w”或“w/”是with的缩写，它们的后面跟的是要做消融对比的对象。

魔法自动机

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
深度学习|自监督学习、MAE学习策略、消融实验

自监督学习、MAE学习策略、消融实验的思想介绍，方便更好读懂机器学习相关的论文。
复制链接

扫一扫

专栏目录

魔法自动机 CSDN认证博客专家 CSDN认证企业博客

码龄7年

147: 原创

1万+: 周排名

9011: 总排名

19万+: 访问

: 等级

3362: 积分

1311: 粉丝

867: 获赞

60: 评论

1322: 收藏

私信

关注

热门文章

分类专栏

最新评论

C++学习|CUDA内存管理代码实例
魔法自动机: n表示你有多少个线程运行，每个线程会有一个tid，编号从0到n-1，所以不是只对一个元素。
C++学习|CUDA内存管理代码实例
未来某知名程序员: threadIdx.x就是 vecAdd<<< 1, n >>>(A, B, C)中的n吗，那tid不就是5？ C[5]=A[5] + B[5] 只是对一个元素做了运算啊
Matlab图像处理| 图像批量读取和存储、开闭运算
魔法自动机: 读Matlab代码时候，会有很多很方便的代码功能。很难准确收到用法的时候，可以在命令行中写个简单的变量测试一下，同时运行也会提供工作区来查看各个变量内容和大小。
深度学习| 注意力机制
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
深度学习| 注意力机制
征途黯然.: 这篇文章对于深度学习注意力机制提供了很多信息，很有深度。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。