自监督和无监督学习的差别

skyeah_

于 2024-07-10 17:16:29 发布

阅读量381

点赞数 3

文章标签：学习

本文链接：https://blog.csdn.net/skyeah_/article/details/140329482

版权

自监督学习（Self-Supervised Learning）和无监督学习（Unsupervised Learning）都是无需人工标注数据的机器学习方法，它们在目标和方法上有所不同。

定义：自监督学习是一种机器学习方法，它利用数据本身生成标签，通过设计预训练任务来让模型学习有用的特征表示。模型在没有外部标注的情况下，通过解决自我生成的任务（pretext tasks）来学习。

特点：

优点：

应用：

定义：无监督学习是一种机器学习方法，它直接从未标注的数据中发现数据的内在结构和模式。模型在没有任何标签的情况下，通过对数据的探索和聚类来学习。

特点：

目标：发现数据的结构、模式或分布。
方法：常见的方法包括聚类、降维和密度估计等。
示例：
- 聚类：K-means、层次聚类（Hierarchical Clustering）等。
- 降维：主成分分析（PCA）、t-SNE等。
- 密度估计：高斯混合模型（GMM）等。

优点：

应用：

标签的生成：
- 自监督学习：通过设计预训练任务，利用数据的内在属性生成伪标签。
- 无监督学习：完全不生成标签，而是直接分析数据的结构和模式。
目标：
- 自监督学习：通过预训练任务学习特征表示，通常用于提升下游有监督任务的性能。
- 无监督学习：发现数据的内在结构、模式或分布，通常用于数据探索和理解。
方法：
- 自监督学习：预训练任务，如掩码语言模型、图像拼图等。
- 无监督学习：聚类、降维、密度估计等。