大模型综述

本文概述了大模型的发展历程,包括从早期的CNN到现代的GPT系列(如GPT-4和ChatGPT)、LLaMa系列、GLM和开源/闭源模型的演变。特别提到了像盘古、文心一言和星火认知大模型这样的代表性AI产品及其技术特点。
摘要由CSDN通过智能技术生成

1.概念

大模型是指人工智能预训练大模型,具有海量参数和复杂架构,用于深度学习任务的模型,拥有强大的处理能力和表征能力,以数据+算力为支撑,借助数据管理、模型训练、评估优化、服务平台、插件等辅助工具,开发基础大模型或行业大模型,再延伸至工业、金融、医疗、交通等下游场景应用。

 2.发展

分为三个阶段:

萌芽期 1950-2005 ): CNN 为代表的传统神经网络模型
沉淀期 2006-2019 ): Google 提出的基于自注意力机制的神经网络结构 - Transformer 架构
爆发期 2020- 至今):
GPT3 2020 ): 1750 亿 参数规模
ChatGPT 2022.11 ):自然语言交互与 多场景 内容生成
GPT-4 2023.4 ): 多模态 理解与多类型内容生成

3.GPT系列

GPT由OpenAI开发的一系列基于人工神经网络的自然语言处理模型,提出“生成式预训练(无监督)+判别式任务精调(有监督)”的范式来处理NLP任务。

模型由开源向闭源发展,构建技术壁垒。

4.LLaMa系列

Chinese- LLaMA -Alpaca (中文 LLaMA-2 基座模型和 Alpaca-2 指令精调大模型) :在原版 Llama-2 的基础上 扩充、优化了中文词表 ,使用了大规模中文数据进行增量预训练,进一步提升了中文基础语义和指令理解能力,最高支持 64K 上下文长度。

5.GLM系列

GLM是清华与智谱AI共同研制的一个开放的双语(英汉)双向密集预训练语言大模型基于Transformer架构构建,具有强大的自然语言处理能力,能够实现对文本的理解、生成和生成式理解,被誉为“自然语言处理领域的黑科技”。

6.其它模型

Falcon阿联酋阿布扎比的技术创新研究所(TII)开发,包含:Falcon-7B Falcon-40BFalcon-180B分别基于 1.5 万亿、 1 万亿、3.5 万亿 token数据训练而得Falcon-180B是最大的开源预训练模型。
VicunaUC伯克利大学的研究人员联合其它几家研究机构共同推出的基于LLaMA微调的大语言模型, Vicuna 1.5系列包含Vicuna 7BVicuna 13B以及Vicuna 7B 16KVicuna 13B ,基于LLaMA2微调的,支持免费商用。

盘古:华为开发的一系列大规模自回归中文预训练语言模型,盘古3.0提供10B参数、38B参数、71B参数和 100B参数的基础大模型,提供NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力。

文心一言:百度发布的人工智能大语言模型,文心大模型4.0拥有万亿级别参数,是国内首次用万卡集群训练的大预言模型,在语言理解和生成方面性能更优,具备更强的推理和创造能力,支持多语言处理,可以轻松应对不同国家和地区的语言需求。

星火认知大模型:科大讯飞发布的大预言模型,星火大模型V3.0版本,进一步升级了数学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。

百度-文心一言:是百度全新一代知识增强大语言模型,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息知识灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。

科大讯飞-星火认知大模型:具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。

  • 23
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值