LLM参数 llm_kwargs

Absurddddd

已于 2024-03-18 00:28:55 修改

阅读量1.5k

点赞数 36

文章标签： python langchain 语言模型

于 2024-03-17 23:52:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Absurdreal/article/details/136792027

版权

大多数开源LLM框架中，都会需要指定LLM参数。这些参数通常是用一个词典—— llm_kwargs 来存储。

使用案例

answer_generator = LLMChain(
    llm=MY_LLM, 
    prompt=PROMPT,
    llm_kwargs={
        "max_new_tokens": 512,
        "top_p": 0.9,
        "temperature": 0.6,
        "repetition_penalty": 1.2,
        "do_sample": True,
    }
)

常用参数列表

（参考LangChain官网：langchain_community.llms.huggingface_endpoint.HuggingFaceEndpoint — 🦜🔗 LangChain 0.1.12）

参数名	参数类型 = 默认值 (HuggingFace)	描述
temperature	Optional[float] = 0.8	较低的温度会使LLM更加诚实，较高的温度会更加有创造力（范围0-1）如果是0，则给定相同输入，每次输出结果不变。 (HuggingFace 默认值 0.8，LangChain默认值0.7)
max_new_tokens	int = 512	最大生成的tokens数量。
top_p	Optional[float] = 0.95	采样涉及的百分比（top percentage）只考虑前百分之多少进行采样。（范围0-1）
top_k	Optional[int] = None	只采样排名前k个词，根据`likelihood scores` 来采样。（范围1-正无穷）如果取值为1，则和`greedy decoding` 效果一样。
repetition_penalty	Optional[float] = None	重复生成的惩罚。惩罚之前生成过的token。降低该token的概率。（范围1-正无穷）取值为1.0意味着不惩罚。论文：https://arxiv.org/pdf/1909.05858.pdf
do_sample	bool = False	是否激活概率采样，能激活的采样可以是：多项式抽样、束搜索多项式抽样、Top-K抽样和Top-p抽样。（temperature、top_p、top_k都是基于概率采样的方式，所以要求do_sample=True才可以起作用）

Top_p 通常设置为一个较高的值（如 0.75），目的是限制低概率选项。同时使用 top_k 和 top_p ，则意味着：既满足 top_k 又满足 top_p。如果同时启用 k 和 p，top_p 将在 top_k 之后起作用。

参考文献（推荐阅读）

LLM的decoding策略：https://towardsdatascience.com/decoding-strategies-that-you-need-to-know-for-response-generation-ba95ee0faadc

Hugging Face 文本生成策略以及对应的参数设置：

https://huggingface.co/docs/transformers/generation_strategies

top_k 和 top_p 的区别：

Predictable Outputs

关注

36
点赞
踩
39

收藏

觉得还不错? 一键收藏
1
评论
LLM参数 llm_kwargs

大多数开源LLM框架中，都会需要指定LLM参数。这些参数通常是被用一个词典llm_kwargs来存储。这些llm_kwargs有哪些？都分别是什么意思？
复制链接

扫一扫

Absurddddd CSDN认证博客专家 CSDN认证企业博客

码龄5年

5: 原创

126万+: 周排名

15万+: 总排名

7474: 访问

: 等级

142: 积分

38: 粉丝

76: 获赞

2: 评论

103: 收藏

私信

关注

热门文章

最新评论

LLM参数 llm_kwargs
CSDN-Ada助手: 恭喜您发布了第5篇博客！看到您对LLM参数llm_kwargs有深入的探讨，让我感到非常钦佩。希望您能继续保持创作的热情，不断挖掘更多有趣的主题，或许可以考虑探讨LLM参数在不同领域的应用案例，或者深入研究其与其他参数的关系，相信会有更多人受益于您的分享。期待您的下一篇作品！
2023华为机考 24届实习最后一题 —— 管道漏水（“接雨水”的变形题）
CSDN-Ada助手: 恭喜您成功完成2023华为机考的最后一题！看到您的标题我也感到十分激动，接雨水的变形题听起来确实十分有趣。希望您在实习中也能够继续保持这种探究问题的精神，不断挑战自我，不断进步。我的建议是，如果您感兴趣的话，可以考虑尝试写一些关于实习中遇到的挑战和解决方法的博客，分享您的心得和经验，既能够帮助自己总结经验，又能够帮助更多的人。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。