大模型-模型预训练-预训练任务

一个研究技术、玄学、金融的干过码农的人

于 2024-09-23 17:48:57 发布

阅读量300

点赞数 3

分类专栏：大模型文章标签：人工智能深度学习大模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sgliquangang/article/details/142463629

版权

大模型专栏收录该内容

15 篇文章 0 订阅

订阅专栏

一、简介

1、预训练任务目的

设计合适的自监督训练任务，使得模型能够从海量五标注数据中学习到广泛的语义知识与世界知识

2、常见预训练任务

语言建模
去噪自编码
混合去噪器

二、语言建模

1、特点

被目前绝大多数模型采用
核心在于预测下一个词元
经常被用于训练基于解码器架构的大模型
是一种多任务学习过程，可同时学习到生成时用到的相关知识与能力

2、任务内容

基于前序内容生成或预测后续内容

3、变种

前缀语言建模
- 特点：主要应用与采用前缀解码器架构的大模型
- 缺点：由于总损失仅计算后缀词元，性能稍逊于使用标准语言建模任务进行预训练的模型
中间任务填充
- 任务内容：训练模型对于中间部分文本的预测生成能力
- 特点：
  - 常用于作为标准语言建模任务的辅助任务
  - 通常用于训练代码预训练模型，提升模型代码补全能力

4、应用情况

应用范围：被绝大部分大模型采用
代表模型：GPT

三、去噪自编码

1、特点

实现比语言建模复杂，需要设定额外的优化策略，如词元替换策略、替换片段长度、替换词元比例

2、任务内容

输入文本经过一系列替换或删除，形成损坏文本，模型任务目标是根据损坏文本恢复出被替换或删除的片段

3、应用情况

应用范围：比语言建模应用少
代表模型：BERT、T5等模型

四、混合去噪器

1、任务内容

又称UL2损失，通过将语言建模和去噪自编码的目标均视为不同的去噪任务，对于预训练任务进行了统一建模

2、组成

S-去噪器
R-去噪器
X-去噪器

3、特点

S-去噪器与前缀语言建模目标相同
R-去噪器、X-去噪器与去噪自编码目标相似，二者在被掩盖（删除）片段的跨度以及损坏比例上有区别，R-去噪器掩盖比例约为15%，每个被掩盖片段包含3-5个词元；X-去噪器掩盖比例约为50%，每个被掩盖片段包含12个词元以上

4、如何选择去噪器

在句子开头设置特定词元（比如R、X、S）标记去噪器类型

5、应用情况

应用范围：较小
代表模型：UL2、PaLM2等

一个研究技术、玄学、金融的干过码农的人

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

一个研究技术、玄学、金融的干过码农的人 CSDN认证博客专家 CSDN认证企业博客

码龄12年

387: 原创

1万+: 周排名

5374: 总排名

31万+: 访问

: 等级

7049: 积分

934: 粉丝

997: 获赞

50: 评论

944: 收藏

私信

关注

热门文章

分类专栏

玄学 4篇
大模型 15篇
数码 3篇
项目管理 1篇
后端 4篇
中间件、工具 16篇
办公 8篇
算法 23篇
Java 42篇
产品 1篇
区块链 1篇
Linux 11篇
C、C++ 2篇
编程基础 1篇
前端 1篇
iOS 151篇
python 1篇

最新评论

Java-设计模式
倾听一世，繁花盛开: 写的太完美了，互关一下吧
codeblock couldn‘t create project directory ：path
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
iOS 数据库升级
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
iOS 数据库升级
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
iOS runtime
普通网友: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。