今天,在华为开发者大会2024(HDC 2024)上,华为常务董事、华为云CEO张平安正式发布盘古大模型5.0,在全系列、多模态、强思维三个方面全新升级;张平安还分享了盘古大模型在自动驾驶、工业设计、建筑设计、具身智能、媒体生产和应用、高铁、钢铁、气象等领域的丰富创新应用和落地实践,持续深入行业解难题。
此外,华为诺亚方舟实验室主任姚骏、华为云CTO张宇昕分别就盘古大模型5.0技术解密和华为云全栈系统性创新发表主题演讲,详细解读华为云在AI领域的全栈创新优势。
▲华为常务董事、华为云CEO张平安
发布盘古大模型5.0
盘古大模型5.0,在全系列、多模态、强思维
三个方面做了全新升级
全系列: 盘古大模型5.0包含不同参数规格的模型,以适配不同的业务场景。十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;百亿级参数的Pangu P系列,适用于低时延、高效率的推理场景;千亿级参数的Pangu U系列适用于处理复杂任务;万亿级参数的Pangu S系列超级大模型能够帮助企业处理更为复杂的跨领域多任务。
多模态: 盘古大模型5.0能够更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。在图片和视频识别方面,可支持10K超高分辨率;在内容生成方面,采用业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,聚焦自动驾驶、工业制造、建筑等多个行业场景,可生成更加符合物理规律的多模态内容。
▲升级后多模态理解能力得到了大幅提升
看得更细致,理解更聪明
▲《清明上河图》海量信息中
大海捞针的挑战也能轻松应对
强思维: 复杂逻辑推理是大模型成为行业助手的关键。盘古大模型5.0将思维链技术与策略搜索深度结合,极大地提升了数学能力、复杂任务规划能力以及工具调用能力。
过去一年中,盘古大模型持续深耕行业
已在30多个行业、400多个场景中落地
重塑自动驾驶
盘古大模型5.0通过创新的可控时空生成技术,结合场景视频生成、4D BEV视频生成、自动驾驶仿真库及路网信息,能更好地理解物理规律,大规模生成和实际场景相一致的驾驶视频数据,还可以灵活增加控制条件,生成不同路况、不同光照、不同天气的训练视频数据,加速自动驾驶技术的快速成熟。
▲生成车身四周,六个摄像头视角的视频
可直接用于自动驾驶训练
▲生成晴天,雨天,黑夜的行车视频
让自动驾驶学会应对丰富多样的场景变化
重塑工业设计
以新车造型设计为例,周期一般需要1-2年,盘古大模型可以让汽车的造型设计时间大幅缩短。造型设计师可以将自己的灵感,通过对话、画图与大模型交互,生成3D汽车数字模型,并可进行风格化调整、零部件编辑、颜色更换等。盘古大模型生成的数字模型还可直接输出成3D文件,支持10几种主流格式,设计师可以直接3D打印成样品,减少制作油泥模型的轮次,极大地节省成本和时间。
除了汽车造型设计,盘古大模型还可以用于汽车的工装设计、模具设计,以及电子产品领域的工业设计等。
重塑建筑设计
基于盘古大模型的可控生成能力,只需输入设计的黑白草图,即可生成彩色并带有纹理的建筑群360°实景视频;基于盘古3D重建能力,还可以构建出高真实感的建筑3D模型,将复杂建筑群的概念设计周期从数周缩短到数十分钟,助力建筑师创造出更加出色的建筑作品。
重塑具身智能
盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。
重塑媒体内容生产和应用领域
盘古大模型能够将实拍视频快速转换成特定风格的动漫,并保持角色样貌特征前后一致,舞蹈、武打等大运动轨迹也能确保合理一致的视觉效果;能自动将视频译制成不同语言,并保留原始角色的音色、情感、语气;将译制配音、动漫生成等场景的制作周期从月级缩短到天级,大大提升制作效率,作品一次拍摄多元化制作,实现价值最大化。
还能通过AI翻译和拟人化语音合成能力,实现AI同声传译,让云会议、视频通话等可以实现母语交流体验。
重塑高铁
全国每天需要检测的动车大概有3.2万节车厢,过去需要大量的巡检工人在凌晨时段去完成,耗时耗力。如今结合盘古大模型和巡检机器人,可精准识别一列动车的3.2****万个项点,覆盖8大类、350多种复杂故障,帮助高铁提升运营效率,降低成本,减少人工在凌晨时段去巡检的艰辛作业。
重塑钢铁
以上海宝武钢铁热轧生产线为例,每次调整生产钢板的种类和尺寸,都需要工程师重新调整7道精轧机组的300多个参数,需要耗费约5天的时间。盘古大模型能够对最优参数进行预测,显著降低热轧生产线调优时间,并提高预测精度和钢板成材率。目前盘古大模型目前已在宝钢1880热轧生产线上线,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。此外,盘古大模型还将应用于高炉场景,对炉温、铁水温度、硅含量等炉况进行仿真,从而辅助高炉精准控制,充分利用每一分能源,降低能源成本。
重塑气象
华为云在分辨率为25公里的全球模型基础上,融合区域高质量气象数据集,升级了分辨率分别为1公里、3公里、5公里的区域预报能力,包含气温、降雨、风速等气象要素。不仅如此,今年华为云还联合天融环境打造了环境大模型,将污染六项的预测准确度全面提升10% 以上。
重塑医药
天士力基于盘古大模型打造“数智本草大模型”。一方面基于盘古的L0基础模型,学习训练了4000多万篇文献,尤其是学习了1000多本古籍,从古方古籍和现代文献中总结出知识和经验,可以赋能方剂筛选和优化、提升研发效率,也能辅助医生问诊。另一方面,天士力在盘古17亿化合物的药物分子大模型基础上,增训了350万天然产物分子数据,未来有望更好地优化方剂和发现新药。
华为云对昇腾AI云服务进行持续优化。业界万亿参数模型训练的平均无中断时长约2.8天,昇腾AI云服务可实现40天无中断;业界平均集群故障恢复时间约60分钟,昇腾AI云服务可以缩短到10分钟,同时能将大模型的资源开通时间从月级缩短到天级,加速大模型的开发。
目前昇腾AI云服务已全面适配行业主流的100多个大模型,以云服务的方式协助客户开发,训练,托管和应用模型,打造百模千态的“黑土地”。
▲左滑查看更多
大模型训练推理用华为云昇腾AI云服务
澎湃算力,即开即用
华为云CTO张宇昕表示,通过全栈系统性创新,能够让大模型的数据准备、训练、推理、应用实现全流程的高效率和高性能。华为云的全栈系统性创新覆盖了数据中心、云平台架构和基础设施服务,为AI开发提供AI Native的基础设施。
当前云平台在大模型的训练和使用中通常存在“算力墙”“内存墙”“能效墙”等问题。为此,华为云打造了下一代的云基础设施CloudMatrix,改变传统数据中心的架构和算力供给模式,将传统的以CPU为中心的主从架构,演进为多元算力对等全互联架构;并通过高速互联网络协议,将CPU、NPU、GPU等算力资源全部互联和池化,从而把AI算力从单体算力演进到矩阵算力,开启智能算力新纪元。
同时,针对云平台在大模型的训练和使用中存在的“内存墙”问题,华为云正式发布EMS弹性内存存储服务,基于Memory Pooling专利技术,通过显存扩展、算力卸载、以存代算等三大手段来打破内存墙,释放极致算力。
▲点击了解EMS弹性内存存储
基于新一代云基础设施和EMS弹性内存存储服务、昇腾AI云服务等创新,华为云已经在贵安、乌兰察布和芜湖,构建了三大AI算力中心CloudOcean;同时也在华北、华东、华南等热点区域部署了AI算力资源池CloudSea;还通过华为云CloudLake和CloudPond边缘云平台,将AI算力推到客户身边,提供最低时延的AI训推服务。由此,华为云打造了云、网、边、端协同的AI Native的算力平台,提供给开发者、客户和伙伴使用。
盘古大模型也是基于华为云的AI平台开发。会上,华为诺亚方舟实验室主任姚骏从数据高效、参数高效和算力高效三个方面介绍了盘古大模型5.0的训练过程。
▲华为诺亚方舟实验室主任姚骏
介绍盘古大模型5.0关键创新
同时,华为云对AI开发生产线ModelArts进行升级,在AI开发基础设施和流水线之上,构建了大模型即服务平台ModelArts Studio,提供百模千态的第三方大模型托管服务,支持对大模型定制开发,并提供相应的工具和行业集成套件,让客户可以方便地将大模型与业务系统结合。
除了系统性创新,华为云还将盘古大模型和华为在产品研发、数据治理、安全防护、业务运维等各个领域积累的数据和经验相结合,“跳了自己的降落伞”,应用在了华为云CodeArts、DataArts、MetaStudio和GaussDB、云安全等系列云服务的智能化上。将华为云的服务重塑和升级,从而更智能、更高效。
软件开发:华为云通过结合AI Agent能力,将CodeArts软件开发生产线从单点智能升级到项目级智能,大幅提升了问题定位率和项目级问题修复成功率,让开发者能轻松实现项目级智能。
数据治理: 华为云将盘古大模型和华为多年数据治理经验相结合,让不熟悉IT技术的业务人员、管理人员可以通过自然语言交互的方式,快速获取需要的数据,形成可视化的图表,直接高效地管数、用数。
数字内容生产: 华为云将盘古媒体大模型和华为有着深厚积累的音视频编解码、3D模型物理仿真、图形渲染等引擎能力相结合,一起用于AI内容生成。这样生成的数字内容更符合物理世界的规律,并且可以实现任意时长的实时互动,突破了当前AIGC的局限。
数据库: 华为云将产品文档、专家知识、运维经验等数据库专业数据和大模型相结合,构建盘古数据库大模型,让GaussDB数据库在开发、测试、迁移、运维等全生命周期实现智能化,显著提升开发人员和DBA的使用效率。
安全: 华为云打造了面向安全领域的盘古安全大模型,能够快速、精准地给出安全治理咨询的专业意见,让企业安全更加智能。
华为云是华为公司面向开发者的统一底座,目标打造昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等各项根技术的生态,给广大开发者一个更优的选择。
专属开发空间: 为了让开发者更好地学习和使用这些技术,华为云为每个新生态的开发者免费提供一台云主机、一套开发工具和5GB的云存储空间。
专利和科技交流社区: 华为在Chaspark网站上提供了开放的专利搜索工具-查思专利,开发者可以免费查询到全球近1.9亿件专利数据,与华为共同进步与成长。
开发者布道师计划: 未来3年计划发展超过3000名华为开发者布道师。
技术创新要和行业场景需紧密结合才能真正实现深耕行业,华为云派出500+ 技术专家深入行业,了解客户需求,解决行业难题。
▲左滑查看更多
深入行业解难题、做难事
“
张平安强调,一直以来,华为云盘古大模型都坚定地聚焦行业,在解难题、做难事的道路上不断攻坚克难,砥砺前行,重塑千行万业。华为云将与所有的客户、伙伴和开发者一起,创新不止,攀登不止,让云无处不在,让智能无所不及,加速千行万业的智能升级。
”
那么,如何系统的去学习大模型LLM?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~
篇幅有限,部分资料如下:
👉LLM大模型学习指南+路线汇总👈
💥大模型入门要点,扫盲必看!
💥既然要系统的学习大模型,那么学习路线是必不可少的,这份路线能帮助你快速梳理知识,形成自己的体系。
👉大模型入门实战训练👈
💥光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉国内企业大模型落地应用案例👈
💥《中国大模型落地应用案例集》 收录了52个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。 (文末领取)
💥《2024大模型行业应用十大典范案例集》 汇集了文化、医药、IT、钢铁、航空、企业服务等行业在大模型应用领域的典范案例。
👉LLM大模型学习视频👈
💥观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。 (文末领取)
👉640份大模型行业报告👈
💥包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
👉获取方式:
这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓