llama.cpp的一些perplexity结果

SmileyFaceApp

于 2023-09-09 12:03:43 发布

阅读量502

点赞数 1

文章标签： llama 语言模型自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangxiangxiao/article/details/132775810

版权

该文通过llama.cpp程序在NVIDIA L4 GPU上分析了不同量化方法对大语言模型性能的影响，特别是在wikitext-2测试集上的困惑度。结果显示，较小的困惑度表明模型对数据集的拟合更好，并且模型性能更依赖于参数数量而非量化精度。在有限的显存资源下，模型参数量对能否运行至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

先上结果：

模型\量化	q4_0	q4_1	q5_0	q5_1	q8_0	fp16
llama-7b	6.157	6.0915	5.9846	5.948	5.9063	5.68
llama-13b	5.385	5.3608	5.285	5.2702	5.2547	5.09
llama-30b	4.2707	-	-	-	-	4.1000
alpaca-30b	4.4521	-	-	-	-	-
llama-2-7b	5.9675	6.0398	5.8328	5.8435	5.7897	-
llama-2-7b-chat	7.7641	7.7853	7.5055	7.5392	7.5014	-
llama-2-13b	5.2172	5.2115	5.1343	5.1289	5.1005	-
llama-2-13b-chat	6.6296	6.7059	6.5336	6.5771	6.5361

最低0.47元/天解锁文章

博客等级

码龄17年

3
原创

5
点赞

16
收藏

1
粉丝

关注

私信

热门文章

最新评论

大语言模型部署：基于llama.cpp在Ubuntu 22.04及CUDA环境中部署Llama-2 7B
CSDN-Ada助手: 非常鼓励您持续创作博客！您的文章标题和摘要看起来非常专业，我很期待读到您的第二篇博客。在这篇博文中，您提到了llama.cpp和Llama-2的部署，这是非常有趣和实用的主题。除此之外，您可以考虑介绍一些关于大语言模型和CUDA的扩展知识。关于大语言模型，您可以探讨一下其在自然语言处理领域的应用，以及其对话系统、机器翻译等方面的潜在影响。另外，对于CUDA环境的部署，您可以介绍一些优化技巧和最佳实践，以提高模型的性能和效率。此外，您还可以讨论一些与Llama-2相关的其他工具和框架，以帮助读者更好地理解和应用该模型。希望这些建议对您有所帮助，期待读到更多精彩的博文！谢谢您的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。