自监督学习-论文笔记

自监督学习近两年的一些比较好的方法:SimCLR, MoCo, BYOL。关于这几个方法有一个博客值得一看:https://generallyintelligent.ai/blog/2020-08-24-understanding-self-supervised-contrastive-learning/

自监督学习中,近几年一个很热门的方向是自监督对比学习,包括SimCLR,MoCo,CPC等方法都是基于对比学习的自监督学习方法。对比学习中一个比较重要的内容是对比损失函数。

对比损失函数

SimCLR

论文:A Simple Framework for Contrastive Learning of Visual Representations   ICML  2020

MoCo

论文:Momentum Contrast for Unsupervised Visual Representation Learning  CVPR 2020 最佳论文提名

动量对比学习。

BYOL

论文:Bootstrap Your Own Latent A New Approach to Self-Supervised Learning  NIPS 2020

与SimCLR和MoCo不同,这个方法并没有使用到对比学习。

DINO

论文:Emerging Properties in Self-Supervised Vision Transformers。ICCV 2021

论文有两个版本,一个是ICCV正式接收的版本,另一个是arxiv的版本,arxiv版本的内容更丰富一些,建议两个对比着进行学习。

自监督学习最新的一个方法,效果很好。与上面几种方法最大的不同是,这个模型用的基础模型是vision transformer。

该方法在进行自监督学习时的整体框架与前面几种方法是相似的,即都使用了不同的数据增强方式,设计一个辅助任务,并计算损失,这个方法不是显式基于对比学习的,所以自监督任务的损失函数并不是损失函数,而是一个交叉熵损失函数。DINO算法框架如下图所示:

上图中,有一个学生模型和教师模型,实际上这个地方和 MoCo 中是一样的,教师模型首先通过学生模型进行初始化,后面之后采用momentum的方式进行更新。

DINO 中在学生/教师模型得到样本的表征之后,projection head 进行的是soft-max操作,这里和前面SimCLR、MoCo、BYOL等几个方法都是不太一样的。softmax处理中使用的温度参数,即 temperature scaling, 目的是控制数据的分布,避免形成长尾分布或者尖峰分布。

教师模型得到样本表示之后进行一个centering的处理,作用是锐化样本表示的distribution,然后进行softmax处理,softmax的作用是平滑数据分布,所以这里centering和softmax两个处理形成了一个对抗的过程,避免模型的坍塌,即避免所有图像都收缩到一个点。

这篇论文的销蚀实验分析很重要,包括progection head, loss function, 分类头的选择,教师模型是否进行动量方式的更新等。

论文另一个很重要的实验研究是关于自监督场景下基于vision transformer学习到的特征与有监督学习任务中学习到的特征的可视化分析。如下图所示:

从这个图片中可以看出,自监督任务学习到的样本特征和有监督场景下学习到的特征分布是非常不同的。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: mid机器学习2004年期中考试是2004年进行的一次机器学习课程的期中考试。该考试旨在对学生对于机器学习的理解和掌握程度进行评估。 在这次考试中,我猜测会包括以下内容: - 机器学习的基本概念:如何定义、目标和应用领域等。 - 机器学习算法:如决策树、朴素贝叶斯、支持向量机等。 - 机器学习的评估指标:如准确率、召回率、F1分数等。 - 特征选择和特征抽取:如何选择和提取对数据分类有用的特征。 - 模型训练和测试:如何使用数据集来训练和测试机器学习模型。 - 处理过拟合和欠拟合:如何解决机器学习模型出现过拟合或欠拟合的问题。 在准备考试时,我会通过以下方式来提高自己的准备水平: - 复习课堂讲授的内容,重点关注课件中的示例和步骤。 - 做练习题和习题集,检验自己对概念和算法的理解和运用能力。 - 阅读相关的机器学习教材和论文,了解最新的研究进展和应用案例。 - 参与学习小组或与同学讨论,互相学习和解决问题。 - 寻找机器学习竞赛或项目,实践应用所学知识。 考试结束后,我会总结自己的答题情况,分析和反思自己的不足和问题,以便在期末考试前做出相应调整和提高。通过这次考试,我期望能够深入理解机器学习的基本概念与原理,并具备独立解决实际问题的能力。 ### 回答2: mid机器学习2004年期中考试是机器学习领域中的一次重要考试,旨在评估学生对机器学习相关知识的理解和应用能力。 考试内容包括以下几个方面: 1. 机器学习基础知识:包括机器学习的定义、分类和应用领域等。 2. 监督学习算法:如线性回归、逻辑回归、决策树等,要求学生掌握这些算法的原理和应用场景。 3. 无监督学习算法:如聚类、主成分分析等,要求学生了解这些算法的概念和常见使用方法。 4. 模型评估与选择:要求学生了解模型评估的指标,如准确率、精确度、召回率等,以及如何选择最佳模型。 5. 特征工程:要求学生了解特征选择、降维等方法,并能够应用到实际问题中。 6. 深度学习基础知识:要求学生了解神经网络的基本结构和训练方法。 为了备考此次考试,学生可以通过以下几个途径: 1. 复习课堂笔记和教材:对机器学习的基本概念和常用算法进行系统复习。 2. 完成练习题和作业:通过做一些实际的练习题和作业,巩固对各种算法和方法的理解和应用。 3. 进行小组讨论和合作学习:与同学一起讨论复习问题,相互帮助解决难点。 4. 查阅相关文献和资料:阅读一些经典的机器学习论文和书籍,加深对机器学习理论的理解。 总的来说,mid机器学习2004年期中考试对于学生来说是一次全面评估机器学习知识和能力的机会。学生需要通过系统学习和刻苦复习,掌握机器学习的基本概念和常用算法,以便在考试中取得良好的成绩。 ### 回答3: MID是机器学习(Machine Learning)课程在2004年的期中考试。机器学习是一门涉及计算机科学、统计学和人工智能等多个领域的学科,旨在让计算机系统通过学习和经验来改善性能,而不是通过明确编程。 在MID期中考试中,学生可能会收到一份试卷,其中包含与机器学习相关的问题和问题。这些问题可能涉及机器学习的基本概念、算法和应用。学生需要根据所学的知识和理解,以适当的方式回答这些问题。这可能包括定义术语、解释概念、说明算法的工作原理,或者展示如何在特定情境中应用机器学习方法。 2004年是机器学习领域的一个重要时刻,当时该领域正处于蓬勃发展的阶段。在这个时期,学生可能会听到一些经典的机器学习算法和模型,如决策树、支持向量机和神经网络。此外,考试还可能涉及到机器学习的应用领域,如自然语言处理、图像识别和数据挖掘等。 参加MID期中考试的学生需要对机器学习的基本概念和原理有清晰的理解,并能灵活运用这些知识解决实际问题。通过这个考试,学生有机会展示他们对机器学习的理解和掌握程度,并且对未来的发展和研究方向有一个更好的认识。 最后,这个考试的目的是帮助学生巩固所学的机器学习知识,并为他们在未来的学习和职业发展中提供基础。通过这个考试,学生能够评估自己在机器学习中的能力,并为进一步学习和提高做好准备。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值