自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(96)
  • 收藏
  • 关注

原创 进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

为数据中心提供前所未有的计算能力。在NVL72系统中,NVLink Switch实惊人的130TB/s的GPU带宽,极大增强大型模型的并行处理能力,使得多服务器集群可以随着计算量的增加而扩展GPU通信,支持的GPU数量是单8个GPU系统的9倍。作为NVIDIA数据中心解决方案的关键构建模块,NVLink和NVLink Switch整合英伟达AI Enterprise软件套件和NVIDIA NGC™目录中的硬件、网络、软件、库及优化的AI模型和应用程序,为用户提供全面的AI计算解决方案。

2024-05-10 17:12:55 1636

原创 AI 赋能大模型:从 ChatGPT 到国产大模型的角逐与发展契机

在 GPT - 4o 之前,使用语音模式与 ChatGPT 对话时,GPT - 3.5/GPT - 4 的平均延迟分别为 2.8/5.4 秒,而GPT - 4o 可以在短至 232 毫秒的时间内响应音频输入,平均时长为 320 毫秒,与人类在一次谈话中的响应时间相当。Decoder则主要用于生成文本。与传统语言模型相比,大模型在自然语言理解和复杂任务处理方面具有显著优势,其发展呈现出 “规模定律”(Scaling Law)的特征,即模型的性能与模型的规模、数据集大小以及训练所用的计算量之间存在幂律关系。

2024-09-25 10:35:25 1293

原创 AI为云游戏带来的革新及解决方案:深度技术剖析与未来展望

黑神话:悟空》作为一款划时代的游戏作品,不仅以其对《西游记》这一古典名著的深刻致敬与独特诠释吸引了全球玩家的目光,更以其背后强大的AI技术支持,展示了游戏产业在智能化时代的无限可能。从智能角色的细腻表现到动态游戏世界的构建,从个性化游戏体验的定制到高效游戏开发与测试的推进,《黑神话:悟空》无疑是AI技术在游戏产业中深度应用的生动例证。《黑神话:悟空》作为AI技术的杰出展示,不仅将传统文化与现代科技完美融合,更预示了游戏产业在AI的赋能下,将持续探索未知,开创更加辉煌的未来,丰富人类的文化娱乐世界。

2024-09-12 15:16:33 1019 1

原创 探索GPU算力在大模型和高性能计算中的无限潜能

随着算法的不断优化和创新,GPU算力将在更多未知的领域展现出强大的应用潜力,为人类解决前所未有的复杂问题,创造更多难以想象的价值。它具有较高的时钟频率和复杂的缓存层次结构,能够高效地执行单个线程的指令,对于顺序执行的任务,如操作系统的运行、通用计算中的复杂算法等,表现出色。无论是自然语言处理中的语言模型,还是计算机视觉中的图像识别和目标检测模型,亦或是强化学习中的智能体训练,GPU算力都为其提供了高速的计算能力,使得模型能够处理更复杂的任务、达到更高的精度和准确性。

2024-09-11 17:05:43 1789

原创 ​​​​​​​《黑神话:悟空》—— 高科技点亮西游神话璀璨之路

《黑神话:悟空》是一款以中国神话为背景的里程碑式游戏,它运用空间计算、光线追踪、AI、DLSS 3等技术,打造出美轮美奂的画面和沉浸感十足的游戏体验。PC集群和Stable Diffusion的应用为游戏带来诸多优势,包括提高开发效率、改善性能、优化资源利用、促进大数据分析等。PC集群能处理物理模拟和AI计算,提升游戏的流畅度和真实感。这些技术的协同运用,不仅为玩家带来精彩体验,也为游戏行业树立了新标杆,展示了科技在游戏发展中的重要作用。

2024-09-03 16:52:10 1503

原创 WAIC 2024 AI盛宴大会亮点回顾

来自不同科技公司的人形机器人排成两行,组成了壮观的“十八罗汉”阵列,仿佛从科幻电影中走出的机器人军团。今年入选的八大镇馆之宝中,既有支付宝智能助理这样的生活助手,也有Vimi可控人物视频生成大模型这样的创意神器。这些车辆不仅拥有超前的设计理念,更在自动驾驶技术上实现了重大突破,让人对未来出行充满了无限遐想。他们围绕人工智能的发展、安全、治理等议题展开了激烈的讨论和思想碰撞,为全球人工智能的未来发展贡献了宝贵的智慧和力量。这场全球瞩目的人工智能盛会,不仅汇聚了全球顶尖的智慧,还带来了无数令人惊叹的创新成果。

2024-07-09 08:44:00 367

原创 AI 驱动的数据中心变革与前景

文章主要探讨了AI计算时代数据中心的转型,涉及计算技术的多样性、规格尺寸和加速器的发展、大型语言模型(LLM)的发展、功耗和冷却趋势、基准测试的重要性以及数据中心的发展等方面。随着LLM的增长,数据中心的机架功率从历史上的每机架10至20千瓦线性增长至每机架75至100千瓦甚至更高,这可能导致新的绿色数据中心的增加,改造现有的旧数据中心以满足这些需求将是一项挑战。技术的不断创新、计算需求的持续增长、对能源效率和可持续性的重视,以及政策法规的影响等因素,都将塑造数据中心的未来格局。

2024-07-04 15:47:07 939

原创 中国计算机学会芯片大会 (CCF Chip 2024)

🎉 #CCF Chip 2024# 主题前瞻:"发展芯技术,智算芯未来" —— 芯片技术,数字世界的基石,国际竞争的前沿!#芯片技术 #学术交流 #科技创新 #产学研合作 #科技竞赛 #CCFChip2024。论坛盛况:46场前沿技术论坛,200余位专家学者,共论芯片技术新篇章。科技竞赛:EDA算法加速挑战赛,定制计算算法实现挑战赛,激发创新潜能。国际化视野:汇聚中外院士,产学研杰出代表,共话全球科技趋势。院士领航:15位中国科学院和工程院院士,为您指引科技航向。

2024-06-21 12:31:45 580

原创 Apple Intelligence 十大问答 | Apple 将 AI PC推波助澜

Apple刚刚举行了其最具开创性的。

2024-06-13 10:14:45 990

原创 AMD 在 Computex 2024 宣布7月推出 Zen 5 锐龙 9000 处理器并展示 Ryzen 9000 CPU 和 AI PC 架构

​AMD在台湾台北举行的Computex 2024上揭开了Ryzen 9、7和5系列中四款新的4nm Zen 5驱动的Ryzen 9000处理器的盖子,新的Zen 5架构芯片将于7月上市。将每周期指令数(IPC)吞吐量提高16%。AMD声称新的旗舰Ryzen 9 9950X在游戏方面比英特尔的竞争对手Raptor Lake Refresh旗舰产品平均高出11%,在生产力工作负载方面平均高出21%。这些芯片在 AI 和 AVX-512 工作负载中的性能也翻了一番。

2024-06-05 13:19:28 1325

原创 NVIDIA Computex 2024 - 英伟达携手计算机行业共筑人工智能工厂与数据中心

英伟达(NVIDIA)在2024年的Computex上宣布了一系列重大的合作和技术发展,旨在推动人工智能(AI)的进一步发展。华擎Rack、华硕、GIGABYTE、Ingrasys、Inventec、Pegatron、QCT、Supermicro、Wistron和Wiwynn等公司将使用NVIDIA GPU和网络技术提供多种AI系统。Jensen Huang,英伟达的创始人兼CEO,提到了与NVIDIA合作的公司和国家正在将传统数据中心转向加速计算,并建立新型的人工智能工厂。

2024-06-04 15:21:14 369

原创 马斯克大模型xAI官宣拿到60亿美元B轮融资,估值突破1300亿人民币

这笔资金将有助于xAI加速其聊天机器人Grok的开发和迭代,使其与OpenAI的GPT、Meta的Llama、Anthropic的Claude和Google的Gemini等人工智能领导者的大模型表现保持一致。5月27日消息,马斯克旗下的大模型创企xAI官宣拿到60亿美元(折合约435亿人民币)B轮融资,估值达到约180亿美元(折合约1304亿人民币),一举跃升独角兽。xAI 此次60亿美元融资在AI初创公司融资规模中处于较高水平。

2024-05-28 11:01:52 278

原创 微软刚发布的Copilot+PC为什么让Intel和AMD尴尬?2024 AI PC元年——产业布局及前景展望

微软这次推出的Copilot + PC需要每秒40万亿次操作(TOPS)的NPU,目前只有Windows PC生态系统中的单个芯片才能满足这一要求,该芯片甚至还不完全可用:高通的Snapdragon X Elite和X Plus,在未来几个月内将在新的Surface和戴尔、联想、惠普、华硕、宏碁和其他主要PC OEM等一些PC上推出。Copilot+ PC的旗舰功能之一是Recall,这是一个由人工智能驱动的功能,可以为您在PC上所做的和看到的所有内容创建一个可搜索的“照片存储器”。

2024-05-24 18:26:16 1163

原创 人类将会永生?谷歌 DeepMind重磅发布Alphafold 3 ——天花板级别的AI系统

AlphaFold 3基于Transformer构建,允许科学家输入生物分子复合物的描述,能预测该生物分子复合物的3D结构,并使用扩散过程生成每个原子的单独3D坐标,输入到指定系统。标志着在这一领域的一个重大突破,其对生物分子结构及相互作用的全方位预测能力,预示着对人类健康和疾病治疗的深远影响。作为一个以整体方式计算整个分子复合物的单一模型,不仅可以预测蛋白质的结构,还可以预测几乎所有生命分子的结构,包括蛋白质、DNA、RNA、配体等对于蛋白质与其他分子类型的相互作用,从而能对药物发现带来至关重要的作用。

2024-05-11 15:49:57 753

原创 SQL标准的演变

GQL 的发展始于 2010/2011 年引入 Cypher,这是Neo4j开发的图形查询语言,于 2015 年演变为 OpenCypher,最终于 2019 年过渡到 ISO 标准 GQL。GQL 用于 Property Graph,具有高性能和可扩展性,适用于大量和复杂的数据。借助 graph/GQL,人们可以对数百万个关系进行图形遍历,来揭示隐藏的洞见。自几十年前SQL 的最后一次重大改进以来,数据库行业引入了一种新的ISO/IEC 标准语言,称为GQL ,即图形查询语言,标志着一个重要的里程碑。

2024-04-28 11:52:46 381

原创 液冷是大模型对算力需求的必然选择?|英伟达 GTC 2024六大亮点

在这个以高性能计算和大模型推动未来通用人工智能时代,算力已成为科技发展的隐形支柱。本文将重点探讨算力的演进,深入分析在不同领域中算力如何成为推动进步的基石;着眼于液冷如何突破算力瓶颈成为引领未来的先锋,对液冷散热的三种方式(冷板式、浸没式和喷淋式)做了详细的对比分析、成本测算和市场空间预测。并为您提供一份“实用教程”,指导如何将普通服务器改装为液冷服务器,以应对越来越复杂的计算需求。

2024-04-10 14:18:50 1307

原创 英伟达要小心了!爆火的Groq芯片能翻盘吗?AI推理速度「吊打」英伟达?

随着科技的飞速发展,人工智能公司Groq挑战了英伟达的王者地位,其AI芯片不仅展现出卓越的实力,还拥有巨大的潜力。Groq设计了一种独特的推理代币经济学模式,该模式背后牵动着众多因素,却也引发了深度思考:新的技术突破来自何处?中国该如何应对并抓住变革中的机遇?Groq成本如何评估?这些都是值得研究和思考的问题。

2024-03-08 09:55:13 1022

原创 7万张H100打造的Open AI文生视频Sora功能原理详解|Sora注册全攻略

近日,OpenAI发布的基于Transformer架构的文生视频Sora,可谓是在AI圈掀起新的热潮。该模型具有强大的视频生成能力,可产生高达一分钟的高清视频,并且用户可以自由指定视频时间长度、分辨率和宽高比。据OpenAI的观点,Sora的诞生可能预示着物理世界通用模拟器的重大突破。

2024-02-29 12:08:02 1867

原创 CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗?| DALL-E 3、Stable Diffusion等20+ 图像生成模型综述

CES作为颇具影响力的科技展览,展示芯片硬件到终端应用的全方位科技成果,涉及AI、VR、消费电子、汽车电子和智能家居等领域,标志着未来科技的方向。一、AI PCAI PC作为本次盛会主角,集结全链条科技力量,包括芯片、系统和终端,预示着AI PC元年来临。戴尔、惠普、华硕、三星等知名厂商的AI PC产品势如破竹,在硬件提升、AI助手整合和性能优化方面展示出其领先地位。特别是大多数AI PC都增加AI专用启动键。英伟达、AMD、英特尔等核心元件制造商的最新AI PC芯片部署,使整体计算能力有了显著的提升。

2024-01-25 10:40:01 1548 1

原创 展望2024: 中国AI算力能否引爆高性能计算和大模型训练的新革命?

2023年是人工智能发展的重要转折年,企业正在从业务数字化迈向业务智能化。大模型的突破和生成式人工智能的兴起为企业实现产品和流程的革新提供了先进工具,引领产业迈入智能创新的新阶段。在这个新时代,企业不再仅关注如何增强智能化能力,而更加注重如何利用人工智能实现产品和流程的革新。

2024-01-05 10:09:33 2231

原创 AGI时代的奠基石:Agent+算力+大模型是构建AI未来的三驾马车吗?

AI Agent的训练离不开算力,服务器作为一个强大的计算中心,为AI Agent提供算力基础,支持其进行复杂计算和处理大规模数据的任务,包括模型训练、推理和处理大规模数据集。

2023-12-21 13:54:17 2093

原创 探索AIGC未来:CPU源码优化、多GPU编程与中国算力瓶颈与发展

近年来,AIGC的技术取得了长足的进步,其中最为重要的技术之一是基于源代码的CPU调优,可以有效地提高人工智能模型的训练速度和效率,从而加快了人工智能的应用进程。同时,多GPU编程技术也在不断发展,大大提高人工智能模型的计算能力,更好地满足实际应用的需求。本文将分析AIGC的最新进展,深入探讨以上话题,以及中国算力产业的瓶颈和趋势。

2023-12-08 12:27:21 1694 2

原创 马斯克星链与芯事:30亿美元炸出卫星互联网革命,GPU算力创无限可能

据最新消息,马斯克“千人上火星计划”又一次未能如愿。据不完全统计,他在星舰项目上投入至少30亿美元,总投入超过200亿人民币。然而,尽管投入巨大,星舰研发道路仍然充满坎坷。早在今年4月,运力超过150吨的“史上最强运力”火箭在发射后几分钟内就在夜空中崩裂解体。自4月首飞以来,SpaceX对星舰进行1000多次改进。在11月18日21点,星舰33台推进器完成检测,进入预发射状态。发射3分钟后,飞船与推进器成功分离,9分钟后按照预定程序关闭引擎。然而,就在SpaceX团队为这一重要里程碑庆祝时,二级火箭发生故障

2023-11-24 11:32:59 1199

原创 多GPU训练大型模型:资源分配与优化技巧 | 英伟达将推出面向中国的改良芯片HGX H20、L20 PCIe、L2 PCIe

在人工智能领域,大型模型因其强大的预测能力和泛化性能而备受瞩目。然而,随着模型规模的不断扩大,计算资源和训练时间成为制约其发展的重大挑战。特别是在英伟达禁令之后,中国AI计算行业面临前所未有的困境。为了解决这个问题,英伟达将针对中国市场推出新的AI芯片,以应对美国出口限制。本文将探讨如何在多个GPU上训练大型模型,并分析英伟达禁令对中国AI计算行业的影响。

2023-11-16 12:02:25 2122 7

原创 GPT-4 Turbo 发布 | 大模型训练的新时代:超算互联网的调度与调优

算力对训练模型的重要性日益凸显。随着大模型训练的流行,全球显卡和算力正在快速增长。算力后周期市场也在迅速崛起。其中“后”更多是指后服务市场,涵盖从显卡服务器到货IDC之后,形成稳定算力到输出稳定商业推理结果全过程。该过程主要涉及云化、调优、调度、部署、落地和数据管理等环节。

2023-11-09 09:38:41 1524

原创 一文详解多模态大模型发展及高频因子计算加速GPU算力 | 英伟达显卡被限,华为如何力挽狂澜?

近年来,全球范围内的芯片禁令不断升级,给许多企业和科研机构带来了很大的困扰,需要在技术层面进行创新和突破。一方面,可以探索使用国产芯片和其他不受限制的芯片来替代被禁用的芯片;另一方面,可以通过优化算法和架构等方法来降低对特定芯片的依赖程度。

2023-10-26 12:37:02 1119

原创 高性能计算与多模态处理的探索之旅:英伟达GH200性能优化与GPT-4V的算力加速未来

随着人工智能技术的不断发展,多模态大模型成为越来越重要的发展趋势。GPT-4V(GPT-4 近日开放的视觉模态)大型多模型(LMMs)扩展大型语言模型(LLMs)以增强多感知技能(如视觉理解等)从而实现更强大的通用智能。本文着重对GPT-4V进行深入分析,以进一步深化对LMM的理解。在此本文分析核心是GPT-4V可以执行的任务,同时包含用于探测其能力质量和通用性的测试样本。

2023-10-19 11:29:15 913

原创 深度学习模型部署与优化:策略与实践;L40S与A100、H100的对比分析

随着生成式AI应用的迅猛发展,我们正处在前所未有的大爆发时代。在这个时代,深度学习模型的部署成为一个亟待解决的问题。尽管GPU在训练和推理中扮演着关键角色,但关于它在生成式AI领域的误解仍然存在。近期英伟达L40S GPU架构成为了热门话题,那么与A100和H100相比,L40S有哪些优势呢?

2023-10-06 11:37:27 1185

原创 高性能计算环境下的深度学习异构集群建设与优化实践

★深度学习;模式识别;图像处理;人工智能建模;人工智能;深度学习算法;强化学习;神经网络;卷积神经网络;人工神经网络;VIBE算法;控制系统仿真;机器学习;高性能计算;数据挖掘;超算;ACL;算力;计算机视觉;PSU;Transformer;PLM;SLM;NLM;LLM;Galactica;OPT;OPT-IML;BLOOM;BLOOMZ;GLM;Reddit;H100;H800;A100;A800;MI200;MI250;LaMA;OpenAI;GQA;RMSNorm;SFT;RTX 4090;A600

2023-09-24 22:02:51 563

原创 揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速

本文主要介绍大模型的内部运行原理、我国算力发展现状。大模型指具有巨大参数量的深度学习模型,如GPT-4。其通过在大规模数据集上进行训练,能够产生更加准确和有创造性的结果。大模型的内部运行原理包括输入数据的处理、多层神经网络计算和输出结果生成。这些模型通常由数十亿个参数组成,需要庞大的计算资源和高速的存储器来进行训练和推理。

2023-09-09 23:23:35 2675

原创 如何在SAM时代下打造高效的高性能计算大模型训练平台

学术界有多篇论文探讨SAM 的 ZSL 能力, 如《SAM.MD: Zero-shot medical image segmentation capabilities of the Segment Anything Model》测试 SAM 的 ZSL 效果,在图像分割任务中输入部分点和框作为 prompt 提示,结果显示:专家用户可以通过 SAM 实现大部分场景下的快速半自动分割。总的来说,SAM-Track是在SAM基础上的有意义的研究成果,为视频分割和跟踪领域的研究和应用带来了新的可能性。

2023-08-21 04:27:07 567

原创 英伟达 H100 vs. 苹果M2,大模型训练,哪款性价比更高?

训练和微调大型语言模型对于硬件资源的要求非常高。目前,主流的大模型训练硬件通常采用英特尔的CPU和英伟达的GPU。然而,最近苹果的M2 Ultra芯片和AMD的显卡进展给我们带来了一些新的希望。

2023-07-28 16:36:16 865

原创 CPU、GPU与算存互连的复杂比较与重要性分析

据科技部新一代人工智能发展研究中心发布的报告显示,我国已发布79个参数规模超过10亿的大模型,几乎形成了百模大战的局面。在大模型研发方面,中国14个省区市都在积极开展工作,其中北京拥有38个项目,广东拥有20个项目。

2023-07-06 12:32:01 1031

原创 通往AGI之路:揭秘英伟达A100、A800、H800、V100在高性能计算与大模型训练中的霸主地位

一位AI从业者提到,他所在的公司曾考虑使用一家非NVIDIA的GPU厂商,对方的芯片和服务报价更低,也承诺提供更及时的支持,但他们最终判断,使用其他GPU会导致整体训练和开发成本高于使用NVIDIA,并且还需要承担结果的不确定性和花费更多的时间。因此,使用性能较低的GPU越多,计算力的损耗就越大。Transformer基于显著性的注意力机制为输入序列中的任何位置提供上下文信息,使得它具有强大的全局表征能力、高度并行性、位置关联操作不受限,通用性强,可扩展性强等优势,从而使得GPT模型具有优异的表现。

2023-06-29 12:10:48 5601 1

原创 突破边界:高性能计算引领LLM驶向通用人工智能AGI的创新纪元

ChatGPT的成功带动整个AIGC产业的发展,尤其是LLM(大型语言模型,大语言模型)、NLP、高性能计算和深度学习等领域。LLM的发展将为全球和中国AI芯片、AI服务器市场的增长提供强劲动力,据估算,LLM将为全球和中国AI服务器带来约891.2亿美元和338.2亿美元的市场空间。

2023-06-25 15:06:50 669

原创 研发为底、生态为径、AI为翼——全国一体化算力算网调度平台正式发布

研发实力是一家芯片设计公司的核心竞争力,英伟达从发展初期就重视研发生产力,以高投入换取高回报不断提升产品竞争力。2005 年,AMD 的研发费用为 11 亿美元,是英伟达的 3.2 倍左右。而到了 2022 年,英伟达的研发费用达到 73.4 亿美元,是 AMD 的 1.47 倍。

2023-06-15 16:01:42 1324

原创 2023北京智源大会亮点回顾 | 高性能计算、深度学习和大模型:打造通用人工智能AGI的金三角

北京智源大会中黄铁军表示,从“第一性原理”出发,通过构建一个完整的智能系统AGI,从原子到有机分子到神经系统、到身体,实现通用人工智能。这是一个大概需要20年时间才能实现的目标。分别包括大模型方向、具身方向,以及智源自己期望方向的进展。

2023-06-15 14:34:26 1349

原创 COMPUTEX2023|NVIDIA GRACE HOPPER为加速生成式AI而设计的超级芯片全面投产

5 月29 日,英伟达在 2023 台北电脑展大会推出了DGX GH200 AI超级计算机,这是配备256颗Grace Hopper超级芯片和NVIDIA NVLink交换机系统的尖端系统,具有1 exaflop性能和144TB共享内存。

2023-06-02 12:04:29 491

原创 AIGC和ChatGPT推进百度、阿里、腾讯、华为大模型技术创新

据艾媒咨询预测,2023 年中国 AIGC 核心市场规模将达 79.3 亿元,2028 年将达 2767.4 亿元。中国互联网的高度普及率,以及不断提升的企业数字化程度,为 AIGC 产业提供了优越的发展环境。

2023-05-25 15:37:29 2269

原创 ChatGPT与深度学习的完美融合:打造智能化推荐系统新时代

新技术如ChatGPT、LLM、AIGC等的兴起,使推荐系统拥有更强的学习和预测能力。然而,推荐算法仍然是深度学习推荐系统中不可或缺的关键技术。推荐算法和这些技术应相辅相成,相互补充。推荐算法中的冷启动问题、Explore & Exploit、流行度纠偏、打散重排等问题,都是ChatGPT等技术未考虑的。AutoRec、Deep Crossing、NeuralCF、PNN、Wide&Deep、NFM、AFM、DIEN等模型的引入,丰富了推荐算法的解决方案,使得推荐系统更具智能和个性化。未来,推荐算法和Cha

2023-05-19 16:17:51 730

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除