AIGC领域大模型信息汇总

LLM(Large Language Model)是指大型语言模型,是一种基于深度学习的自然语言处理技术。2022年末到现在,短短半年时间,AIGC领域可以说是日新月异,技术更新过快,需要持续关注,才能够对整个领域有更为全面、客观的认知,因此,整理这篇文章,持续跟踪进展。

模型汇总

模型名称发布机构使用的技术参数数量发布时间主要应用
GPT-4OpenAITransformer网络未知2023年多模态文本阅读理解
GPT-3.5OpenAITransformer网络175B2022年聊天机器人
GPT-3OpenAITransformer网络175B/13B/6B/2.7B/1.3B/175M2020年语言翻译、聊天机器人、内容创作等
GPT-2OpenAITransformer网络1.5B/774M/355M/117M2019年低成本解决方案
GPT-1OpenAITransformer网络117M2018年文本生成,第一代GPT
BardGoogle未知未知2023年聊天机器人
LLaMAMeta未知7B/13B/30B/65B2023年聊天机器人
AlpacaStanford预训练模型未知2023年自然语言生成
LMFlowHKUST预训练模型未知2023年自然语言生成
Auto-GPT




Dolly 2.0可商用开源预训练模型
2023年类chatGPT
DeepSpeed Chat微软RHLF框架
2023年类chatGPT
Vicuna非商业使用预训练模型
2023年https://vicuna.lmsys.org/
文心一言百度预训练模型未知2023年聊天机器人
通义千问阿里预训练模型未知2023年多模态文本生产
知海图AI知乎预训练模型未知2023年文本生成
DriveGPT毫末智行预训练模型120B2023年自动驾驶领域
商量AI商科科技预训练模型
2023年类chatGPT

33cf6aeb1be6364f9b9feb1f9e74d025.png

产品应用

当下市场上有很多利用GPT-3模型构建的应用,以下是其中一些代表性的应用:

应用名称机构描述官网链接
copy.AI未知基于GPT-3的文本创作工具,自动生成文章和广告文案https://www.copy.ai/
EleutherAI社区驱动由社区驱动的人工智能研究组织,使用GPT-3等模型进行研究和开发,旨在推动人工智能的开放和透明发展https://www.eleuther.ai/
Lobe未知基于GPT-3的图像分类工具,可以快速、准确地识别图像内容https://lobe.ai/
Kryon未知提供智能自动化解决方案的公司,其中包括基于GPT-3的语言生成工具,用于自动化内容创作和客户服务https://www.kryonsystems.com/
Replika未知基于GPT-3的聊天机器人应用,提供个性化的对话体验,旨在提供心理健康支持和情感交流https://replika.ai/
https://www.notion.soNotion功能强大的生产力工具,使用GPT模型提供智能文本格式化、自动链接、语法检查和自动建议等功能https://www.notion.so/
Copilot微软Office系列办公Copilot
CopilotX微软Github系列编码https://copilot.github.com/
chatGPTOpenAI对话/聊天/编码/查资料https://beta.openai.com/docs/api-reference/chat
DALL-EOpenAIAI绘图https://openai.com/product/dall-e-2
Stable Diffusion
AI绘图
MidjourneyMidjourneyAI绘图https://www.midjourney.com/
Blender
文本转3Dhttps://www.blender.org/
Unity
文本转3Dhttps://unity.com/

学习资源

大型模型学习是人工智能和通用计算领域中的热门话题。以下是学习大型模型的一些资源:

  • Deep Learning Specialization是由deeplearning.ai提供的一个深度学习课程系列,涵盖了许多与大型模型相关的主题。

  • The Illustrated Transformer是一篇由Jay Alammar撰写的文章,详细介绍了Transformer模型的内部工作原理。

  • The GPT-3 Deep Dive是一篇由Max Woolf撰写的文章,深入探讨了GPT-3模型的内部机制和潜力。

  • Hugging Face是一个提供各种机器学习模型和工具的开源社区,其中包括GPT-3和LLaMA等大型模型。

  • Papers with Code是一个提供各种机器学习论文和代码的开放资源库,可以帮助您更深入地了解大型模型的最新研究进展。

  • https://www.youtube.com/@AndrejKarpathy openAI大佬AndrejKarpathy下场讲解GPT,系列视频讲解原理。

发展历程

  • 2010年,Hinton提出了深度信念网络(Deep Belief Network,DBN)。

  • 2012年,当时谷歌的神经网络语言模型(Google's Neural Network Language Model)在语言建模任务上取得了很高的准确率。

  • 2012年,Hinton等人使用深度学习技术在ImageNet图像识别比赛中取得了显著的成绩,这标志着深度学习技术开始进入大众视野。

  • 2013年,Google推出了DistBelief,这是一种用于训练大规模深度学习模型的分布式系统,为深度学习在实际应用中的推广奠定了基础。

  • 2014年,Google推出了TensorFlow,这是一种用于构建和训练深度学习模型的开源软件库,为深度学习技术的发展提供了强有力的支持。

  • 2015年,Facebook推出了Caffe2,这是一个高效的深度学习框架,被广泛应用于图像和语音识别等领域。

  • 2015年,谷歌推出了基于长短时记忆网络(LSTM)的大规模语言模型—— LSTM-LM。该模型采用了一个具有多层LSTM单元的循环神经网络架构,模型使用大量的无标注文本训练,能够预测下一个单词或字符的概率分布。

  • 2016年,Google推出了WaveNet,这是一种用于生成高质量语音的深度学习模型,标志着深度学习技术开始被应用于语音合成领域。

  • 2017年,谷歌推出Transformer。Transformer是一种基于注意力机制的神经网络架构,可以用于自然语言处理任务,如机器翻译、问答系统等。Transformer的出现被认为是近年来人工智能领域最重要的突破之一。

  • 2017年,谷歌推出了AutoML,这是一种用于自动化机器学习流程的工具,标志着深度学习技术开始进入自动化阶段。

  • 2018年,OpenAI推出了GAN(Generative Adversarial Network),这是一种用于生成高质量图像的深度学习模型,标志着深度学习技术开始被应用于图像生成领域。

  • 2018年,OpenAI推出了GPT(Generative Pre-training Transformer)模型,该模型采用了Transformer网络,其能够在没有特定任务的条件下进行无监督学习,从而实现了对自然语言的深层次理解。GPT-1模型使用了40GB的文本数据进行训练,可以生成高质量的文章和对话。

  • 2019年,OpenAI又推出了GPT-2模型,该模型使用了更大规模的数据集进行训练,包括了60亿个参数。GPT-2展示了令人惊讶的生成能力,在生成新闻报道、诗歌等任务上表现出了惊人的水平。

  • 2019年,谷歌推出BERT(Bidirectional Encoder Representations from Transformers)模型,该模型采用Transformer网络,使用预训练和微调的方法,可以在许多自然语言处理任务上取得最先进的结果。

  • 2020年,OpenAI推出了GPT-3(Generative Pre-trained Transformer 3),这是一种用于自然语言处理和生成的深度学习模型,拥有1750亿个参数,标续...

  • 2020年,Facebook推出了MADDPG,这是一种用于多智能体强化学习的算法,可应用于协作和竞争场景。

  • 2020年,DeepMind推出了AlphaFold 2,这是一种用于蛋白质结构预测的深度学习模型,被誉为生物学界的“圣杯”。

  • 2020年,百度推出了ERNIE(Enhanced Representation through kNowledge IntEgration)2.0,这是一种基于知识增强的自然语言处理模型,可实现更准确的语义理解。

  • 2021年,OpenAI推出了DALL·E,这是一种用于图像生成的深度学习模型,可以根据文字描述生成符合要求的图像,具有较高的创造性和想象力。

  • 2021年,谷歌推出了MUM(Multitask Unified Model),这是一种用于自然语言理解的深度学习模型,可以同时处理多个任务,实现更全面的语义理解。

  • 2021年,Facebook推出了CLIP(Contrastive Language-Image Pre-Training),这是一种用于视觉和语言理解的深度学习模型,可以实现图像和文本之间的跨模态匹配。

  • 2021年,谷歌推出了LambdaNetworks,这是一种用于图像和视频处理的深度学习模型,采用了新颖的空间转换方法,可以实现更高效的特征提取和处理。

  • 2021年,OpenAI推出了Codex,这是一种用于代码生成的深度学习模型,可以根据自然语言描述生成符合要求的代码,具有较高的实用价值。

  • 2022年,OpenAI推出了gpt-turbo-3.5和chatGPT,点燃了AIGC在消费市场的烈火。

  • 2023年,OpenAI推出GPT-4,AGI雏形初现。

  • 2023年,谷歌推出Bard、Meta推出LLaMa、百度推出文心一言、阿里推出通义千问,不同的科技巨头入场,给出了他们各自的LLM答卷,AIGC领域百花齐放。

  • 未来,GPT-5/GPT-6不断演化,各个科技公司产品不断发展,AGI进入人们生活指日可待。

以上是一些近年来比较重要的人工智能领域大模型,它们的推出和应用,不仅促进了人工智能技术的发展,也为各个领域的应用提供了强有力的支持。

结语

本文介绍了大型语言模型在自然语言处理领域的发展历程、模型汇总和产品应用。然而,随着技术的不断发展和新模型的不断出现,大型语言模型的应用也在迅速扩展。因此,将继续追踪和更新有关大型语言模型的最新发展,以便我们能够及时了解最新技术和应用,为我们的工作和学习提供帮助。

102a91ad47ff2d818a0fe4df8840b9bc.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值