关于 Qwen
- 官网:https://tongyi.aliyun.com
- huggingface : https://huggingface.co/Qwen
- github: https://github.com/QwenLM
- modelscope : https://modelscope.cn/organization/qwen
- Qwen Technical Report : https://arxiv.org/abs/2309.16609
- Discord: https://discord.gg/z3GAxXZ9C
官方文章
- 你好,我是通义千问
https://mp.weixin.qq.com/s/tRXnfcvLFd4xty9tuJQObg - 谁是Qwen?通义千问开源模型技术解析
https://mp.weixin.qq.com/s/MnU6nQfXeepEhgiuUFa6OA - 让大模型拥有视觉,通义千问视觉语言模型Qwen-VL解析
https://mp.weixin.qq.com/s/ddmlrIKFdRRWj3QXa7B_ig - 重磅升级、限时免费,更强的通义千问视觉语言模型来了
https://mp.weixin.qq.com/s/bt-b-tFe-qmjTqHaWG5YbA
- LangChain - Tongyi Qwen
https://python.langchain.com/docs/integrations/llms/tongyi
组成部分
Qwen不仅仅是一个语言模型,而是一个致力于实现通用人工智能(AGI)的项目,目前包含大型语言模型(LLM)和大型多模态模型(LMM)
- Qwen 指的是基础语言模型
- Qwen-Chat 指的是通过`对齐”技术 进行后训练而成的聊天模型。
- 还提供了针对特定领域和任务的模型
- 用于编程的
Code-Qwen
- 用于数学的
Math-Qwen
- 用于编程的
- 大型语言模型(LLM)可以通过模态对齐,扩展到多模态。
- 视觉-语言模型
Qwen-VL
- 音频-语言模型
Qwen-Audio
- 视觉-语言模型
发展历史
- 2023年4月,“通义千问”上线并邀请用户测试体验,是国内最早一批类ChatGPT大模型产品。
- 2023年6月,聚焦音视频内容的工作学习AI助手“通义听悟”上线,成为国内首个开放公测的大模型应用产品。
- 2023年7月,AI绘画创作大模型“通义万相”开启定向邀测。
- 2023年8月,通义千问70亿参数模型Qwen-7B开源,阿里巴巴成为国内首个开源自研大模型的大型科技企业。
- 随后,通义千问陆续开源视觉理解模型Qwen-VL、140亿参数模型Qwen-14B、720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B、音频理解模型Qwen-Audio,率先在业界实现“全尺寸、全模态”开源。
与此同时,通义千问首批通过备案,于2023年9月正式向公众开放。 - 2023年10月底,通义千问升级到2.0版本,参数规模达千亿级,在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,综合性能超过Llama-2-70B和GPT-3.5,加速追赶GPT-4。
- 2023年12月,国内首个官方“大模型标准符合性评测”结果公布,通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。
- 2024年1月,通义千问APP推出新功能“全民舞王”,用一张照片就能让画面中的人物、雕塑、卡通形象等跳起舞来,一时之间风靡海内外社交平台。
通义大模型家族
截至2024年初,通义已经发展成一个大模型家族,成员涵盖基座模型、行业模型和通义千问APP等模型产品。
大语言模型“通义千问”和AI绘画创作大模型“通义万相”是两大基座模型。
基于两大基座模型,通义家族推出了八大行业模型,它们是:
- 通义灵码-智能编码助手
- 通义智文-AI阅读助手
- 通义听悟-工作学习AI助手
- 通义星尘-个性化角色创作平台
- 通义点金-智能投研助手
- 通义晓蜜-智能客服
- 通义仁心-个人专属健康助手
- 通义法睿-AI法律顾问
8大行业模型面向垂直场景,使用领域数据进行专门训练。
用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。
2024-01-23