LLM探索：GPT类模型的几个常用参数 Top-k, Top-p, Temperature

强化学习曾小健

已于 2023-06-21 16:23:35 修改

阅读量6.2k

点赞数 6

分类专栏： LLM大语言模型文章标签： gpt

于 2023-06-21 15:33:28 首次发布

本文链接：https://blog.csdn.net/sinat_37574187/article/details/131328778

版权

LLM大语言模型专栏收录该内容

564 篇文章 ¥199.90 ¥299.90

订阅专栏

超级会员免费看

文章介绍了LLM（大型语言模型）中的关键参数temperature、top-k和top-p的作用。temperature控制输出的随机性，temperature值越大，输出越随机；top-k从最可能的k个选项中随机选择，而top-p基于累计概率动态选择。这两种采样策略与greedydecoding相比，引入了更多的随机性，避免过度依赖最高概率的单词，优化了生成文本的多样性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Top-k抽样	模型从最可能的"k"个选项中随机选择一个	如果k=10，模型将从最可能的10个单词中选择一个
Top-p抽样	模型从累计概率大于或等于“p”的最小集合中随机选择一个	如果p=0.9，选择的单词集将是概率累计到0.9的那部分
Temperature	控制生成文本随机性的参数。较高的温度值会产生更随机的输出，而较低的温度值则会使模型更倾向于选择最可能的单词	较高的温度值，如1.0，会产生更随机的输出，而较低的温度值，如0.1，会使模型更倾向于选择最可能的单词