OpenAI大模型生态相关资料

本文介绍了OpenAI提供的多种大模型,包括GPT系列、图像生成的DALL·E、语音识别的Whisper、文本向量化的Embedding以及审查和编程模型Codex。强调了开源大模型的微调空间、灵活性和成本优势。
摘要由CSDN通过智能技术生成

并不是只有一个模型,而是提供文本、代码、语音、图像等一系列模型

语言类大模型:

GPT-3、GPT-3.5、GPT-4系列模型。并且,OpenAl在训练GPT-3的同时,训练了参数不同、复杂度各不相同的A、B、C、D四项大模型((基座模型),用于不同场景的应用; 其中,A、B、C、D模型的全称分别是ada、babbage、curie和davinci,四个模型并不是GPT-3的微调模型,而是独立训练的四个模型; 四个模型的参数规模和复杂程度按照A-B-C-D顺序依次递增;    虽不如GPT-3.5和GPT-4那么有名,但A、B、C、D四大模型却是目前OpenAl大模型生态中功能最丰富、API种类最多的四个模型;

图像多模态大模型:

最新版为DALL·E(达利) v2,是DALL·E模型的第二版训练版,能够根据描述生成图像;
DALL·E模型为基于GPT-3开发的模型,总共包含120亿个参数,不难看出DALL·E对图像的理解能力源于大语言模型;
OpenAl将大语言模型的理解能力“复制”到视觉领域的核心方法:将图像视作一种一种语言,将其转化为Token,并和文本Token一起进行训练;

语音识别模型:

最新版为Whisper v2-large model,是Whisper模型的升级版,能够执行多语言语音识别以及语音翻译和语言识别;
Whisper模型是为数不多的OpenAl的开源模型,改模型通过68万小时的多语言和多任务监督数据进行的训练,目前提供了原始论文进行方法介绍;
Whisper模型可以本地部署,也可以像其他OpenAl大模型一样通过调用API进行在线使用,并且根据官网介绍,Whisper在线模型会有额外运行速度上的优化,通过调用API进行使用,效率更高(当然也需要支付一定的费用);

文本向量化模型:

Embedding文本嵌入模型,用于将文本转化为词向量,即用一个数组(向量)来表示一个文本,该文本可以是短语、句子或者文章;
最新一代Embedding模型是基于ada模型微调的text-embedding-ada-002模型;通过将文本转化为词向量,就可以让计算机进一步的“读懂文本”,通过词向量的计算和分析和相似度计算,可以对其背后的文本进行搜索、聚类、推荐、异常检测和分类等;

审查模型:

Moderation模型,旨在检查内容是否符合OpenAl 的使用政策。这些模型提供了查找以下类别内容的分类功能:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片等。

编程大模型:Codex大模型,用GitHub数十亿行代码训练而成,能够“读懂"代码,并且能够根据自
然语言描述进行代码创建;
Codex最擅长Python,同时精通JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至Shell等十几种编程语言;
该模型发布于2021年8月10日,目前代码编写功能已经合并入GPT-3.5,官网显示该模型为已弃用(deprecated)状态,意为后续不再单独维护,但并不表示OpenAl已放弃编程大模型,相反越来越多的编程功能被集成到语言大模型中;
目前该模型集成于Visual Studio Code、GitHub Copilot、Azure OpenAl Service等产品中,用于提供自动编程功能支持;

为什么学习开源大模型?

更大的微调空间:相比在线大模型,开源大模型可以使用更多微调框架进行模型微调,微调空间更大,更有可能快速完成定制化大模型训练;
更加灵活的AI应用开发:相比封闭的在线模型,开源模型可以更加灵活便捷的嵌入到Al应用中,同时也可以更加方便的搭配其他开源框架进行使用,从而实现更高效率的Al应用开发;
更低的资费、更安全的数据保障:此外,不同于在线大模型需要根据API调用情况付费,开源大模型开源本地部署,仅需支付相应算力费用即可;此外,数据可以直接本地训练模型,无需在线提交数据进行在线模型微调,数据安全也将更有保障;

  • 24
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值