孟子轻量化多任务模型已开源，登顶 ZeroCLUE 和 FewCLUE 榜单

澜舟孟子开源社区

于 2022-08-23 14:30:12 发布

阅读量655

点赞数

分类专栏：认知智能-NLP前沿观点文章标签：开源机器学习深度学习自然语言处理人工智能

本文链接：https://blog.csdn.net/langboat_mengzi/article/details/126484349

版权

孟子多任务模型开源，以0.22B参数在ZeroCLUE和FewCLUE榜单夺冠。该模型提供出色的Zero-Shot和Few-Shot能力，实现多任务和高效泛化，降低研发和维护成本，已在多个实际场景验证效果。用户可通过Hugging Face Model Hub或GitHub获取。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

经过五个月的开发和场景打磨，孟子多任务模型正式开源，提供出色的 Zero-Shot 及 Few-Shot 能力，以 0.22B 的轻量化模型在零样本学习 ZeroCLUE 和小样本学习权威榜单 FewCLUE 榜单均排名第一，大家可通过 Hugging Face Model Hub 或 GitHub 下载使用（链接见下文）。

孟子多任务模型不仅可以实现“一个模型完成多个任务”，还具备极强的泛化能力，无需大量标注数据就可以完成新任务适配，在应用上能够让模型研发和部署维护更加轻量化。

这与澜舟团队自创立以来一直倡导的 “模型轻量化” 技术路线一脉相承——2021 年孟子轻量化预训练模型仅以十亿参数，战胜了众多百亿、千亿参数的大模型，登顶中文语言理解权威评测基准 CLUE 榜单，并在同年 10 月份开源了四个模型（Mengzi-BERT-base、Mengzi-BERT-base-fin、Mengzi-T5-base、Mengzi-Oscar-base）。

此次开源孟子多任务模型是澜舟团队在“模型轻量化”方面又一个重要进展，期待与各界同仁一起探讨、交流，让轻量化模型赋能更多应用场景。