《OpenCompass 大模型评测》

xyy衍

已于 2024-02-29 15:46:46 修改

阅读量78

点赞数 1

文章标签： python

于 2024-02-21 15:33:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47238261/article/details/136213191

版权

一、笔记

具体课件参照tutorial/opencompass/opencompass_tutorial.md at main · InternLM/tutorial (github.com)

1、介绍

OpenCompass评测对象主要为语言大模型和多模态大模型，语言大模型评测的模型类型包括基座模型（如GPT-3,LLaMA）和对话模型（ChatGPT，书生浦语），其通用能力涵盖学科综合能力、知识能力、语言能力、理解能力、推理能力、安全能力，共计六大维度构造立体全面的模型能力评价体系，采取客观评测与主观评测相结合的方法进行评测。

2、运行步骤

运行评测工具的步骤配置 -> 推理 -> 评估 -> 可视化如下：

二、作业

运行命令如下，得到评测结果（截图）

python run.py
--datasets ceval_gen
--hf-path /share/temp/model_repos/internlm-chat-7b/
--tokenizer-path /share/temp/model_repos/internlm-chat-7b/
--tokenizer-kwargs padding_side='left' truncation='left' trust_remote_code=True
--model-kwargs trust_remote_code=True device_map='auto'
--max-seq-len 2048 --max-out-len 16
--batch-size 4
--num-gpus 1
--debug

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《OpenCompass 大模型评测》

一、笔记二、作业
复制链接

扫一扫

xyy衍 CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

184万+: 周排名

18万+: 总排名

1405: 访问

: 等级

85: 积分

18: 粉丝

15: 获赞

1: 评论

10: 收藏

私信

关注

热门文章

最新评论

【书生·浦语大模型实战营】学习笔记目录
CSDN-Ada助手: 恭喜作者开启了自己的博客创作之旅！看到你已经整理出了《书生·浦语大模型实战营》的学习笔记目录，真是非常用心和认真。希望你在接下来的创作中能够深入挖掘学习笔记内容，结合个人见解和体会进行深入分析和探讨，让读者能够更好地理解和吸收知识。加油！期待你更多精彩的博客内容。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
《轻松玩转书生·浦语大模型趣味 Demo》笔记+作业
CSDN-Ada助手: 非常棒的博客！你的《轻松玩转书生·浦语大模型趣味 Demo》笔记+作业真的让人受益匪浅。希望你能继续分享你的学习和实践经验，让更多人受益。除了使用 InternLM-Chat-7B 模型生成小故事和熟悉 hugging face 下载功能，你还可以尝试使用其他模型进行文本生成，比如 GPT-3 模型等。另外，深入了解 config.json 文件的作用和结构，以及学习如何调整模型的参数和超参数，也能帮助你更好地应用模型进行创作。期待你的下一篇精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。