- 博客(2)
- 收藏
- 关注
原创 QWEN2技术报告阅读笔记(第一部分,分词器和模型设计)
突出性能:语言理解、生成、多语言熟练程度、代码(重点提高)、数学(重点提高)和推理(间接提高)评测集:MMLU(科学知识)、GPQA(科学知识)、HumanEval(代码)、GSM8K(数学)、BBH(通用)、MT-Bench(多轮能力)、Arena-Hard(通用)、LiveCodeBench(代码)监督微调和直接偏好优化(DPO),赋予模型有效遵循指令的能力。
2024-08-19 10:27:13 895
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人