- 博客(5)
- 收藏
- 关注
原创 中英文指令跟随评估测试集
本文提出了一个叫FollowEval的测试数据集,从5个方面:字符串推理、常识推理、逻辑推理、空间推理、回复约束来评估LLM的指令跟随能力。
2024-06-21 18:38:22
263
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
本文提出了一个叫FollowEval的测试数据集,从5个方面:字符串推理、常识推理、逻辑推理、空间推理、回复约束来评估LLM的指令跟随能力。
2024-06-21 18:38:22
263
TA创建的收藏夹 TA关注的收藏夹
TA关注的人