中科院自动化所:紫东.太初

文章讲述了人工智能的发展,从GPT系列的大规模语言模型,如1750亿参数的GPT-3,到中国的鹏程.盘古和紫东.太初等大模型,强调了参数量增长与多模态的重要性。这些模型在NLP和图像处理等领域取得显著成就,展现了AI技术的快速发展和对算力的高需求。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

从16年的AlphaGo,到17年的AlphaZero,再到18年的AlphaFold,再到2020的GPT-3,人工智能演化发展的速度进一步加快。GP从11亿参数的GPT到150亿参数的GPT-2,再到1750亿参数的GPT-3。

1750亿参数的GPT-3。

为了训练GPT-3,微软新建了一个搭载了1万张显卡,价值5亿美元的算力中心。

模型在训练上则消耗了355个GPU年的算力,而成本超过460万美元。

其成果是显而易见的,GPT-3不仅在NLP方面取得了惊人的成就。

GP从11亿参数的GPT到150亿参数的GPT-2,再到1750亿参数的GPT-3。

今年1月,2000亿参数的鹏程.盘古发布。模型学习了40TB中文文本数据,视觉方面则包含超过30亿参数,兼顾了图像判别与生成能力,模型在16个下游任务中大部分指标优于SOTA模型,

除了大规模,多模态也是人工智能发展的重要方向,中科院自动化所推出了全球首个三模态大模型:紫东.太初。获得了MM2021视频描述国际竞赛的第一名,ICCV2021视频理解国际竞赛第一名。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值