【术语3-微调篇】打败99%小白！一学就会的大模型专业术语，读这一篇就够了

冰淇淋百宝箱

于 2024-03-16 06:30:00 发布

阅读量464

点赞数 11

分类专栏：专业术语文章标签：人工智能语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zengzizi/article/details/136725683

版权

本文详细解析了人工智能领域中大模型微调的关键术语，适合初学者快速入门。通过阅读，你将了解如何对预训练模型进行定制化训练，提升模型在特定任务上的性能，达到击败99%新手的水平。

摘要由CSDN通过智能技术生成

缩写	英文名	中文名	简要说明
BERT	Bidirectional Encoder Representations from Transformers	双向编码器表示变压器	预训练深度双向语言模型，使用 Transformer 架构来更好地理解语言上下文。
GPT	Generative Pre-trained Transformer	生成预训练变压器	一个自回归语言模型，使用预训练和微调来生成文本。
T5	Text-to-Text Transfer Transformer	文本到文本转换变压器	将所有NLP任务视为文本间转换问题的统一框架。
RoBERTa	Robustly Optimized BERT Pretraining Approach	鲁棒优化BERT预训练方法	一种改进的BERT预训练方法，通过优化模型的训练过程来提高性能。
XLNet	-	XLNet	结合了自回归语言模型和自编码语言模型的优点，采用置换语言模型预训练方法。
ALBERT	A Lite BERT	精简版BERT	BERT的轻量级版本，通过参数共享和降低模型大小来提高训练效率。
ULMFiT	Universal Language Model Fine-tuning	通用语言模型微调	一种有效的迁移学习方法，通过微调预训练的语言模型来适用于各种下游任务。
ELMo	Embeddings from Language Models	来自语言模型的嵌入	一种基于字符的深层双向语言模型，可以生成词语的上下文相关表示。
MTL	Multi-Task Learning	多任务学习	同时训练一个模型来执行多种任务，以提高模型在各个任务上的性能。
CLS	[CLS] Token (used in BERT)	[CLS] 标记（在BERT中使用）	在BERT训练中使用的特殊标记࿰

最低0.47元/天解锁文章

冰淇淋百宝箱

关注

11
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
1
评论
【术语3-微调篇】打败99%小白！一学就会的大模型专业术语，读这一篇就够了

一种基于梯度下降的优化算法，结合了动量和RMSprop技术，常用于训练深度学习模型。利用在一个任务上学到的知识来提高在另一个相关任务上的表现的机器学习方法。一种技术，用于改善网络训练过程，通过调整每个小批量数据的分布来稳定学习。训练神经网络时减少灾难性遗忘的技术，通过保护重要权重的重要性来实现。一种优化算法，用于训练各种类型的神经网络，通过随机样本更新权重。一种对序列数据进行建模的神经网络，适合处理与时间相关的任务。通过创造变化的训练样本来增加数据集的大小和多样性的技术。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

冰淇淋百宝箱 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。