书生大模型基础岛第六关

OpenCompass 评测 InternLM-1.8B 实践

任务目标:使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能,记录复现过程并截图。

1.设置创建一个新的虚拟环境,安装对应的环境。

2.解压评测数据集到指定文件夹。

3.列出所有跟 InternLM 及 C-Eval 相关的配置,和预计的配置进行对比。

4.设计对应的python脚本hf_internlm2_chat_1_8b.py,然后在确保数据集后运行脚本。

5.最后输出OpenCompass的测评结果。

6.使用配置文件修改参数法进行评测

7.OpenCompass 还允许用户在配置文件中编写实验的完整配置,并通过 run.py 直接运行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值