Qwen 通义千问 - 小记

编程乐园

已于 2024-03-27 15:01:09 修改

阅读量4.6k

点赞数 18

分类专栏： LLM & AIGC 文章标签： Qwen 通义千问

于 2024-01-23 21:21:17 首次发布

本文链接：https://blog.csdn.net/lovechris00/article/details/135790058

版权

161 篇文章

订阅专栏

官方文章

组成部分

Qwen不仅仅是一个语言模型，而是一个致力于实现通用人工智能（AGI）的项目，目前包含大型语言模型（LLM）和大型多模态模型（LMM）

在这里插入图片描述

2023年4月，“通义千问”上线并邀请用户测试体验，是国内最早一批类ChatGPT大模型产品。
2023年6月，聚焦音视频内容的工作学习AI助手“通义听悟”上线，成为国内首个开放公测的大模型应用产品。
2023年7月，AI绘画创作大模型“通义万相”开启定向邀测。
2023年8月，通义千问70亿参数模型Qwen-7B开源，阿里巴巴成为国内首个开源自研大模型的大型科技企业。
随后，通义千问陆续开源视觉理解模型Qwen-VL、140亿参数模型Qwen-14B、720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B、音频理解模型Qwen-Audio，率先在业界实现“全尺寸、全模态”开源。
与此同时，通义千问首批通过备案，于2023年9月正式向公众开放。
2023年10月底，通义千问升级到2.0版本，参数规模达千亿级，在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上，综合性能超过Llama-2-70B和GPT-3.5，加速追赶GPT-4。
2023年12月，国内首个官方“大模型标准符合性评测”结果公布，通义千问成为首批通过评测的四款国产大模型之一，在通用性、智能性等维度均达到国家相关标准要求。
2024年1月，通义千问APP推出新功能“全民舞王”，用一张照片就能让画面中的人物、雕塑、卡通形象等跳起舞来，一时之间风靡海内外社交平台。