国内常用的大语言模型有哪些

最新推荐文章于 2024-10-18 15:35:38 发布

肆十二

最新推荐文章于 2024-10-18 15:35:38 发布

阅读量1k

点赞数 3

分类专栏： AI前沿文章标签：语言模型人工智能自然语言处理

本文链接：https://blog.csdn.net/echoson/article/details/141756580

版权

8 篇文章 1 订阅

订阅专栏

B站：肆十二-的个人空间-肆十二-个人主页-哔哩哔哩视频 (bilibili.com)

博客：肆十二-CSDN博客

问答：(10 封私信 / 72 条消息) 肆十二 - 知乎 (zhihu.com)

目前，中国在大语言模型（LLMs）领域有多个较为著名且具有影响力的模型，这些模型在中文处理能力和应用场景方面表现突出。以下是一些中国知名的大语言模型及其特点：

开发者：阿里巴巴
简介：通义千问是阿里巴巴推出的系列大语言模型，特别是Qwen2-72B模型在多个评测中表现优异，成为国内外多个榜单的顶级开源大模型之一。该模型在理科和文科任务中均展现出色的性能，适用于工业、金融、医疗等垂直专业场景。
特点：其开源策略使其在学术界和工业界都受到了广泛关注和应用，下载量突破2000万次。

开发者：百度
简介：文心一言是百度基于ERNIE系列模型开发的对话模型，专注于中文自然语言处理。文心一言4.0在阅读理解、数学推理等多项任务中表现卓越，尤其在中文语言理解和生成方面有很强的竞争力。
应用场景：广泛应用于智能办公、旅行服务、电商直播、政务服务等领域。

开发者：智谱AI（清华大学）
简介：GLM-4 是由清华大学的团队研发的高性能大语言模型，旨在推动中国在AI领域的研究和应用。它在代码生成和复杂问题解决等任务中表现良好，并且在中文处理任务中与国际顶尖模型相媲美。
特点：尤其在代码能力评测中表现出色，虽然与国际顶尖模型存在一定差距，但在国内已处于领先地位。