最近o1圈很忙,国内先是DeepSeek-R1-Lite上线,阿里国际开源Marco-o1,没几天,阿里千问系列又开源了QwQ-32B-Preview:专注于增强 AI 推理能力。
具体表现如下:
-
强大的数学问题解决能力,在AIME、MATH-500数学评测上,超过了OpenAI o1-preview
-
优秀的编码能力,LiveCodeBench接近OpenAI o1-preview
-
其他方面还有很大的提升空间,比如科学推理能力GPQA
数学推理case,超长推理过程
https://qwenlm.github.io/zh/blog/qwq-32b-preview/
model https://huggingface.co/Qwen/QwQ-32B-Preview
demo https://huggingface.co/spaces/Qwen/QwQ-32B-preview
来源 | PaperAgent