教育领域“知之”大模型--山东大学软件学院2024年项目实训（十一）

ZBT的博客

已于 2024-06-24 13:07:44 修改

阅读量114

点赞数 3

文章标签：人工智能

于 2024-06-23 13:01:26 首次发布

本文链接：https://blog.csdn.net/2201_75314780/article/details/139898691

版权

模型的评估

评估数据集（gsm8k）,之所以选择gsm8k是因为我们想检测一下微调之后模型的推理能力，并且gsm8k在很多篇大模型相关论文中均用来评估性能，说明该数据集的题目具有较好的区分性。

CUDA_VISIBLE_DEVICES=0 swift eval  \
    --model_type 'deepseek-7b-chat'\
    --eval_dataset  gsm8k  \
    --eval_limit 10

CUDA_VISIBLE_DEVICES=0 swift eval --ckpt_dir checkpoint-100 \
    --model_type 'deepseek-math-7b-instruct'\
    --eval_dataset  gsm8k  \
    --eval_limit 10 \
    --merge_lora true

ZBT的博客

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
教育领域“知之”大模型--山东大学软件学院2024年项目实训（十一）

【代码】教育领域“知之”大模型--山东大学软件学院2024年项目实训（十一）
复制链接

扫一扫