参考自:OpenCompass 大模型评测_哔哩哔哩_bilibili
1.为什么需要大模型评测
2评测什么?推理、长文本生成、agent使用、主观认知
3 如何评测
对于基座模型:
对于微调模型:
客观评测:
主观评测:
4 评测框架:
5 OpenCompass
参考自:OpenCompass 大模型评测_哔哩哔哩_bilibili
1.为什么需要大模型评测
2评测什么?推理、长文本生成、agent使用、主观认知
3 如何评测
对于基座模型:
对于微调模型:
客观评测:
主观评测:
4 评测框架:
5 OpenCompass