Qwen 通义千问 - 小记


关于 Qwen


官方文章



组成部分

Qwen不仅仅是一个语言模型,而是一个致力于实现通用人工智能(AGI)的项目,目前包含大型语言模型(LLM)和大型多模态模型(LMM)

在这里插入图片描述


  • Qwen 指的是基础语言模型
  • Qwen-Chat 指的是通过`对齐”技术 进行后训练而成的聊天模型。
  • 还提供了针对特定领域和任务的模型
    • 用于编程的 Code-Qwen
    • 用于数学的 Math-Qwen
  • 大型语言模型(LLM)可以通过模态对齐,扩展到多模态。
    • 视觉-语言模型 Qwen-VL
    • 音频-语言模型 Qwen-Audio

发展历史

  • 2023年4月,“通义千问”上线并邀请用户测试体验,是国内最早一批类ChatGPT大模型产品。
  • 2023年6月,聚焦音视频内容的工作学习AI助手“通义听悟”上线,成为国内首个开放公测的大模型应用产品。
  • 2023年7月,AI绘画创作大模型“通义万相”开启定向邀测。
  • 2023年8月,通义千问70亿参数模型Qwen-7B开源,阿里巴巴成为国内首个开源自研大模型的大型科技企业。
  • 随后,通义千问陆续开源视觉理解模型Qwen-VL、140亿参数模型Qwen-14B、720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B、音频理解模型Qwen-Audio,率先在业界实现“全尺寸、全模态”开源。
    与此同时,通义千问首批通过备案,于2023年9月正式向公众开放。
  • 2023年10月底,通义千问升级到2.0版本,参数规模达千亿级,在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,综合性能超过Llama-2-70B和GPT-3.5,加速追赶GPT-4。
  • 2023年12月,国内首个官方“大模型标准符合性评测”结果公布,通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。
  • 2024年1月,通义千问APP推出新功能“全民舞王”,用一张照片就能让画面中的人物、雕塑、卡通形象等跳起舞来,一时之间风靡海内外社交平台。

通义大模型家族

截至2024年初,通义已经发展成一个大模型家族,成员涵盖基座模型、行业模型和通义千问APP等模型产品。

大语言模型“通义千问”和AI绘画创作大模型“通义万相”是两大基座模型。

基于两大基座模型,通义家族推出了八大行业模型,它们是:

  • 通义灵码-智能编码助手
  • 通义智文-AI阅读助手
  • 通义听悟-工作学习AI助手
  • 通义星尘-个性化角色创作平台
  • 通义点金-智能投研助手
  • 通义晓蜜-智能客服
  • 通义仁心-个人专属健康助手
  • 通义法睿-AI法律顾问

8大行业模型面向垂直场景,使用领域数据进行专门训练。

用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。


2024-01-23

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

编程乐园

请我喝杯伯爵奶茶~!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值