《深度学习》学习笔记（六）

最新推荐文章于 2023-02-27 13:01:55 发布

白炎灵

最新推荐文章于 2023-02-27 13:01:55 发布

阅读量758

点赞数

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_43135165/article/details/124288068

版权

深度学习专栏收录该内容

21 篇文章 6 订阅

订阅专栏

本篇博客主要是讲自监督学习的（Self-Supervised Learning）

文章目录

引入
自监督定义
BERT
GPT series
其他

引入

下面是一些自监督学习的models
在这里插入图片描述
BERT模型340M parameters
ELMO模型94M parameters
GPT-2模型1542M parameters
GPT-3模型175M parameters
Megatron模型8B parameters
Transformer模型1.6T parameters
…

自监督定义

在这里插入图片描述

BERT

BERT输入一行向量，再输出一行向量
在这里插入图片描述

BERT要学习mask的地方与“湾”是同一类别的
BERT+Linear一起训练

但是Next Sentence Prediction好像没啥用？

BERT还可以做很多下游任务，后面会介绍

GLUE

在这里插入图片描述

为了让NLU（自然语言理解）任务发挥最大的作用，来自纽约大学、华盛顿大学等机构创建了一个多任务的自然语言理解基准和分析平台，也就是GLUE（General Language Understanding Evaluation）GLUE九项任务涉及到自然语言推断、文本蕴含、情感分析、语义相似等多个任务。像BERT、XLNet、RoBERTa、ERINE、T5等知名模型都会在此基准上进行测试。

在这里插入图片描述