半监督学习 - 自监督学习（Self-Supervised Learning）

草明

于 2024-01-16 06:00:00 发布

阅读量462

点赞数 7

分类专栏：数据结构与算法文章标签：人工智能机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/galoiszhou/article/details/135548754

版权

数据结构与算法专栏收录该内容

87 篇文章 2 订阅

订阅专栏

什么是机器学习

自监督学习既不是纯粹的半监督学习，也不是纯粹的无监督学习，而是介于两者之间的一种学习范式。在自监督学习中，模型从数据本身中生成标签，而不是依赖外部的人工标签。这使得自监督学习可以利用未标签的大量数据进行训练，同时也可以通过生成的任务来学习有用的表示。

在半监督学习中，自监督学习是一种特殊的方法，其中模型通过自己创建标签并使用这些标签进行训练。自监督学习的目标是通过模型自身在任务中生成的信息来学习有用的表示，而不依赖于外部标签。

自监督学习的基本思想

任务设计：创建一个自我监督任务，其中模型通过对输入数据进行某种变换来生成标签。这样的任务通常是无监督的，因为它不需要外部标签。
模型训练：使用生成的自监督标签和输入数据进行训练。模型尝试最小化生成标签与输入数据之间的差异。
学习表示：通过这个自监督任务，模型学到了能够捕捉输入数据中有意义结构的表示。

自监督学习的常见任务

自编码器（Autoencoder）：自编码器是一种自监督学习的经典方法，其中模型被训练来将输入数据映射到自身，并在重构输入时最小化误差。
Word Embeddings：在自然语言处理中，通过预测上下文中的单词或通过通过遮蔽部分文本并要求模型预测被遮蔽的部分来生成词向量。
图像旋转任务：模型被要求学会正确预测图像旋转的角度，这也被称为自监督学习中的“Jigsaw Puzzle”任务。
颜色化任务：模型通过将灰度图像映射到彩色图像，学习如何表示图像的颜色信息。
对比学习：模型通过将相似样本的表示尽量靠近，而将不相似样本的表示拉远，来学习具有区分性的表示。

优点和应用

无需外部标签：自监督学习不需要外部标签，因此可以利用大量未标签数据进行训练。
泛化能力：通过自监督任务学到的表示通常对其他任务具有很好的泛化能力。
数据丰富：自监督学习可以帮助模型从数据中挖掘更多信息，提高模型在下游任务上的性能。

自监督学习已经在计算机视觉、自然语言处理、语音处理等领域取得了显著的成功，并成为深度学习中一个备受关注的研究方向。

关注

7
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
半监督学习 - 自监督学习（Self-Supervised Learning）

自监督学习既不是纯粹的半监督学习，也不是纯粹的无监督学习，而是介于两者之间的一种学习范式。在自监督学习中，模型从数据本身中生成标签，而不是依赖外部的人工标签。这使得自监督学习可以利用未标签的大量数据进行训练，同时也可以通过生成的任务来学习有用的表示。在半监督学习中，自监督学习是一种特殊的方法，其中模型通过自己创建标签并使用这些标签进行训练。自监督学习的目标是通过模型自身在任务中生成的信息来学习有用的表示，而不依赖于外部标签。
复制链接

扫一扫

专栏目录

草明 CSDN认证博客专家 CSDN认证企业博客

码龄13年

303: 原创

1万+: 周排名

5457: 总排名

35万+: 访问

: 等级

5901: 积分

1884: 粉丝

2194: 获赞

35: 评论

1752: 收藏

私信

关注

热门文章

分类专栏

其他 33篇
数据结构与算法 87篇
Python 8篇
Golang 28篇
mongodb 11篇
运维 21篇
Node.js 8篇
clickhouse 4篇
MySQL 10篇
linux 37篇
Java 5篇
next.js 2篇
APP 10篇
Flutter 3篇
Redis 2篇
React 13篇
Spring Boot 7篇
JavaScript 6篇
docker 12篇

最新评论

MongoDB 数据放在不同的磁盘上
草明: 可以使用 mongodump / mongorestore 进行备份和恢复
MongoDB 数据放在不同的磁盘上
宇宙小神特别萌: 如果现有的 MongoDB 没有启动 --directoryperdb, 现在设置为启动, 则启动会失败 (但是也是可以实现的) 大佬，想请教下如何实现？
MongoDB 数据放在不同的磁盘上
宇宙小神特别萌: 你好，directoryPerDB: false 已经存在数据库情况，当把directoryPerDB: true时，遇到无法启动MongoDB服务问题，错误信息： systemLog: { destination: "file", logAppend: true, path: "D:\tools\MongoDB\Server\4.0\log\mongod.log" } } 2024-07-31T16:39:28.179+0800 I STORAGE [initandlisten] Detected data files in D:\tools\MongoDB\Server\4.0\data created by the 'wiredTiger' storage engine, so setting the active storage engine to 'wiredTiger'. 2024-07-31T16:39:28.179+0800 I STORAGE [initandlisten] exception in initAndListen: InvalidOptions: Requested option conflicts with current storage engine option for directoryPerDB; you requested true but the current server storage is already set to false and cannot be changed, terminating 2024-07-31T16:39:28.179+0800 I NETWORK [serviceStopWorker] shutdown: going to close listening sockets... 2024-07-31T16:39:28.180+0800 I CONTROL [serviceStopWorker] now exiting 请教下解决方案？表情包
Maven error:Fatal error compiling: invalid target release: 11
felekos: 有效，谢谢大佬，我本地配置了多个jdk，默认设置的jdk11，还奇怪为啥不生效呢
Redis info - 内存
今天的我是一滴水:

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。