LLM中的few-shot是什么意思

最新推荐文章于 2025-03-17 09:02:37 发布

yuanlulu

最新推荐文章于 2025-03-17 09:02:37 发布

阅读量832

点赞数 2

分类专栏： LLM 文章标签：自然语言处理 transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuanlulu/article/details/139123476

版权

LLM 专栏收录该内容

21 篇文章

订阅专栏

我上篇博客写了我做的测试Baichuan2-13B模型的一些工作，测试过程免不了要修改代码，在代码中接触了下所谓的few-shot。

比如，所谓2-shot，就是在提示词里提供两个问题和答案，让大模型以为自己回答过问题，后面生成文本会参考前面的内容。2-shot的提示词如下：
在这里插入图片描述
而0-shot，或者zero-shot在正式的问题前面就没有追加的例子。0-shot的提示词如下：

经过我的测试，2-shot的情况下，Baichuan2-13B-Base的C-Eval准确率是0.587,同样的方法，0-shot的情况下则只有0.579。
所以few-shot其实能增加大语言模型的能力的。

参考资料

baichuan2-13b-base的C-Eval得分简析

博客等级

码龄17年

299
原创

1693
点赞

5197
收藏

1631
粉丝

关注

私信

热门文章

分类专栏

最新评论

llamafactory使用8张昇腾910b算力卡lora微调训练qwen2-72b大模型
ccjb88888: 一张卡2分钟20个样本，可谓是慢到极致
mindie1.0新特性及调试问题总结
风尘仆: 好的。已解决
mindie1.0新特性及调试问题总结
yuanlulu: 你确认下你的transformers版本是否正确
mindie1.0新特性及调试问题总结
风尘仆: 遇到过这种报错吗？AttributeError: 'ModelRunner' object has no attribute 'generate_position_ids' 2025-04-14 18:19:45,610 [ERROR] model.py:42 - [Model] >>> return initialize error result: {'status': 'error', 'npuBlockNum': '0', 'cpuBlockNum': '0'} [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared! [ERROR] TBE Subprocess[task_distribute] raise error[], main process disappeared!
使用vllm docker容器部署大语言模型
m0_37567301: 这是啥意思啊，怎么启动，进去容器启动吗

大家在看

SpringMVC中自定义消息转换器处理响应和请求时的Json数据序列化的格式

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。