大模型中temperature、top-p等核心参数解析

shengyin714959

于 2024-08-06 09:14:37 发布

阅读量56

点赞数 4

分类专栏：笔记最高笔记文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shengyin714959/article/details/140945135

版权

笔记同时被 2 个专栏收录

1322 篇文章 73 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

534 篇文章 1 订阅 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

01 背景信息 Background
在选择推理参数之前，我们需要了解一些背景信息。让我们来谈谈这些模型是如何选择要生成哪些单词的。

要阅读一份文档，语言模型会将其分解为一系列的tokens。token只是模型能够轻松理解的一小段文本：可以是一个单词（word）、一个音节（syllable）或一个字符（character）。例如，“Megaputer Intelligence Inc.” 可以被分解为五个token：[“Mega”, “puter”, “Intelligence”, “Inc”, “.”]。

我们熟悉的大多数语言模型都是通过重复生成token序列（sequence）中的下一个token来运作的。每次模型想要生成另一个token时，会重新阅读整个token序列并预测接下来应该出现的token。这种策略被称为自回归生成（autoregressive generation）。

token的自回归生成。

GIF由Echo Lu[1]制作，其中包含了 Annie Surla[2]的一张图片（来自 NVIDIA[3]，经过修改）。

本次修改已获得版权所有者的许可。

这解释了为什么ChatGPT会逐个地输出单词：它在生成内容时就以逐词输出的方式。

如果要选择序列中的下一个token，语言模型首先要为其词汇表中的每个token分配一个可能性分数（likelihood score）。经过模型的评估，如果某个token能够让文本得到合理的延续࿰

了解本专栏

超级会员免费看

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
大模型中temperature、top-p等核心参数解析

然而，它们不像 temperature 那样通过引入随机性，而是通过精心计算的针对性惩罚，为模型生成内容增添多样性在一些罕见的、需要非零 temperature 的任务中（需要对同一个提示语给出多个答案时），可能还需要考虑将小的频率惩罚或存在惩罚加入其中，以提高创造性。当 temperature 设置为零时，模型总是会选择具有最高可能性分数的token，从而导致模型生成的回复缺乏多样性，但却能确保总是选择模型评估出的最高质量的token来生成回复。它能够更加适应输入的上下文，并提供更灵活的筛选。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shengyin714959 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。