【机器学习案例5】语言建模 - 最常见的预训练任务一览表

suoge223

已于 2024-02-16 17:01:07 修改

阅读量1k

点赞数 6

分类专栏：机器学习实用指南文章标签：机器学习人工智能

于 2024-02-16 16:57:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010542847/article/details/136130308

版权

自监督学习 (SSL) 是基于 Transformer 的预训练语言模型的支柱，该范例涉及解决有助于建模自然语言的预训练任务 (PT)。本文将所有流行的预训练任务放在一起，以便我们一目了然地评估它们。

SSL 中的损失函数

这里的损失函数只是模型训练的各个预训练任务损失的加权和。

以BERT为例，损失将是MLM（Masked Language Modelling）和NSP（Next Sentence Prediction）的加权和

多年来，出现了许多解决特定问题的预训练任务。我们将回顾 10 个有趣且流行的函数及其相应的损失函数：

因果语言建模（CLM）
掩码语言建模（MLM）
替换令牌检测 ( RTD )
洗牌令牌检测（STD）
随机代币替换（RTS）
交换语言建模 ( SLM)
翻译语言建模（TLM

最低0.47元/天解锁文章

关注

6
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
【机器学习案例5】语言建模 - 最常见的预训练任务一览表

自监督学习 (SSL) 是基于 Transformer 的预训练语言模型的支柱，该范例涉及解决有助于建模自然语言的预训练任务 (PT)。本文将所有流行的预训练任务放在一起，以便我们一目了然地评估它们。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。