- 博客(34)
- 收藏
- 关注
原创 AMD新一代EPYC 9755处理器刷新CPU-Z多线程性能记录
此外,AMD的EPYC 9005 CPU,配备192个Zen 5c核心,其全部潜力仍待展现,预计这款处理器的性能将非常强大,因为Zen 5微架构带来的改进非常显著。关于这个处理器最有趣的花絮是,它拥有半个字节的L3缓存,但在其型号名称的末尾没有一个“X”的绰号来表示它带有3D V-Cache,类似于AMD的Ryzen 7000和Ryzen 5000系列中的X3 D型号。在服务器和高性能计算(HPC)领域,AMD的EPYC(霄龙)系列处理器一直以其卓越的多线程性能和强大的计算能力著称。
2024-07-26 15:31:33
846
原创 Nvidia Titan品牌或将重生:Blackwell GPU系列的神秘新成员
有趣的是,Blackwell Titan的传闻中带有“AI”后缀。行业似乎仍然热衷于在所有事物上贴上这个缩写。但这是否意味着Titan将更像是Nvidia RTX 6000 Ada一代的继任者,专为通用AI、大型语言模型开发、内容创作和数据科学设计?尽管目前尚无官方确认,但Titan AI显卡的传闻无疑引发了广泛的关注和讨论。如果这款显卡最终成真,它将可能成为AI和高性能计算领域的又一个强大工具。让我们拭目以待,看看Nvidia将如何继续引领AI和GPU技术的发展。**赋创(EMPOWERX)**
2024-07-25 16:25:53
579
原创 AMD EPYC处理器在数据中心性能测试中领先Nvidia Grace CPU
AMD的测试表示,其EPYC处理器在各种关键工作负载中胜过Nvidia的Grace CPU超级芯片,由于其x86-64架构提供广泛的兼容性,并为多样化的数据中心需求提供了经过验证、面向未来的解决方案,这显然是在强调其EPYC处理器在通用数据中心任务上的全面性和经济性。AMD还指出,与基于Arm架构的芯片相比,x86架构在兼容性上的优势。AMD还指出,由于其高性能、能效和与现有软件及基础设施的兼容性,AMD的EPYC处理器比Nvidia的Grace提供更低的总拥有成本(TCO)。
2024-07-24 17:10:40
683
原创 AMD震撼发布:Zen 5架构与XDNA 2技术引领未来计算新纪元!
AMD在XDNA 2架构和Zen 5 CPU方面的最新进展凸显了其引领人工智能和高性能计算革命的承诺。凭借在核心数量、线程、电源效率和人工智能加速方面的突破性改进,AMD将重新定义行业标准并满足现代以数据为中心的工作负载日益增长的需求,确保桌面、移动的、服务器和数据中心应用程序的广泛性能。**赋创(EMPOWERX)作为高性能计算领域的先锋,一直致力于推动技术创新,我们会及时关注最前沿的科技动态,为客户提供高效、可靠的计算解决方案。如果您有GPU服务器。
2024-07-16 14:37:54
496
原创 HBM4技术革新来袭!传输速率高达6.4 GT/s
人工智能、高性能计算、高端图形和服务器等数据密集型应用程序正在越来越多地消耗高带宽内存。JEDEC协会及时发布了第四代标准的初步规范。它提供了大量的性能增益超过其前身,包括更高的带宽,增加容量,提高速度和通道数增加一倍。
2024-07-15 14:57:34
315
原创 中文大模型基准测评2024上半年报告(附下载)
摘要1:国内外大模型差距进一步缩小国内外大模型差距进一步缩小:OpenAI最新模型GPT-4o依然是全球表现最好的模型,但国内大模型已将差距缩小至5%以内。摘要2:国内开源模型崛起本次登顶SuperCLUE的国内大模型为开源模型Qwen2-72B-Instruct,并且超过了众多国内外闭源模型。摘要3:各任务表现在文科、理科和Hard任务中,GPT-4o综合最佳,Claude-3.5在Hard任务表现突出,Qwen2-72B在文科任务表现优异。摘要4:端侧小模型表现惊艳。
2024-07-11 15:43:52
727
原创 2024世界人工智能大会:AI产品技术与未来趋势的深度解析
随着2024年世界人工智能大会(WAIC 2024)在上海的圆满落幕,我们见证了人工智能技术的又一次飞跃。本次大会以“以共商促共享,以善治促善智”为主题,汇聚了全球顶尖的智慧,共同探讨了AI技术的未来趋势和应用前景。以下是我们为您精心整理的本次大会的亮点与趋势,希望能够为您的视野增添一抹亮色。
2024-07-09 15:35:17
892
1
原创 如何看待三星BM1743【61.44TB】悄然发布?
三星的BM 1743 61.44TB SSD是容量最高的SSD之一,在市场上几乎没有竞争对手。目前,只有Solidigm(D5-P5336)和西部数据(SN 655)可以提供61.44TB的PCIe接口容量。其他高容量高性能固态硬盘的开发商,如Kioxia,Micron和SK海力士,还必须推出他们的60 TB级固态硬盘,所以现在,三家公司可以享受他们在市场上的独特地位。不管怎样,三星BM1743 SSD的发布,不仅是对现有存储技术的一次重大突破,也是对未来存储解决方案的一次大胆探索。
2024-07-05 11:31:27
629
原创 GDDR7内存——未来显卡性能的超级加速器
凭借更大的内存容量和更高的带宽,GDDR 7将实现更高级别的GPU计算。随着技术的不断成熟和成本的逐步降低,GDDR7内存有望在未来几年内成为高端显卡的标配之一。总之,GDDR7内存作为未来显卡性能的革命性飞跃点,其出现不仅标志着显存技术的又一次重大突破,更为我们描绘了一个充满无限可能的图形处理新时代。我们期待着看到第一波配备GDDR 7的显卡。*赋创(EMPOWERX)**作为高性能计算领域的先锋,一直致力于推动技术创新,我们会及时关注最前沿的科技动态,为客户提供高效、可靠的计算解决方案。
2024-07-02 16:07:21
780
原创 AI时代的加速器:NPU与GPU的性能对决与应用解析!
不久的将来,你将开始在桌面和笔记本电脑中看到NPU,而且大多数现代智能手机已经在它们的主CPU中集成了NPU,包括过去几年的iPhone、Google Pixel和三星Galaxy型号。NPU中用于矩阵乘法和激活函数的专用硬件意味着它们在实时语言翻译、自动驾驶车辆中的图像识别以及医疗应用中的图像分析等任务中,与GPU相比实现了更优越的性能和效率。最初是为渲染视频游戏中的图形和多媒体应用而开发的,GPU的用途已经显著发展,现在它们被用于许多需要并行处理管理复杂计算的不同应用中。NPU代表神经处理单元。
2024-07-01 15:56:54
492
原创 AMD MI300X 与 NVIDIA H100 性能对比分析
由于其总共四个缓存的组合,包括32KB的L1缓存、16KB的标量缓存、4MB的L2缓存和巨大的256MB无限缓存(作为L3缓存),芯片的缓存性能看起来非常令人印象深刻。Chips and Cheese进行的最后一项测试,显然也是最重要的测试,是AI推理测试,不仅涉及MI300X和H100,还涉及GH200(对于其中一项测试)——与低级测试不同,这次Nvidia GPU是更快的SXM变体。H100 SXM变体也有更快的HBM,提供高达3.35 TB/s的带宽,因此使用2.0 TB/s的卡明显限制了内存带宽。
2024-06-27 15:28:05
864
原创 AMD的1200万GPU AI超级计算机:硬件技术的突破与未来
更不用说,实现这一宏伟目标所需的电力供应,其规模堪比一个核电站。AMD近几年在数据中心和服务器市场的表现突飞猛进,其GPU产品线以技术创新、显著的市场份额增长和出货量提升,以及在能效控制和系统优化方面的领先优势,赢得了市场的认可。特别是第四代EPYC(霄龙)处理器的推出,以其超多核心和高主频特点,为AI和高性能计算任务提供了强大动力,进一步巩固了AMD在高性能计算领域的领导地位。即便是世界上速度最快的超级计算机,如目前运行中的Frontier,也“仅有”37,888个GPU,远未达到数百万的规模。
2024-06-26 15:12:23
340
原创 至强、霄龙 AI 谁更强?英特尔、AMD 各执一词
随着人工智能技术的飞速发展,服务器处理器的性能成为了科技界关注的焦点。近日,英特尔和AMD两大芯片巨头就其第五代服务器处理器在AI负载任务上的性能展开了激烈的辩论。
2024-06-17 15:24:02
950
原创 对Nvidia下一代Blackwell GPU架构和RTX 50系列GPU的了解和期待
Nvidia下一代Blackwell GPU架构和RTX 50系列GPU即将到来,一切按计划进行。尽管Nvidia尚未正式提供任何关于消费级产品何时发布的具体时间框架,但已经有大量关于数据的传言和所谓的泄露。我们也通过一些渠道了解,预计到10月或11月假期季节开始时,我们至少会看到RTX 5090和RTX 5080,然后Blackwell GPU将加入最佳显卡的行列。Nvidia为其数据中心Blackwell B200 GPU提供了许多核心细节。
2024-06-13 15:11:39
1065
转载 E核IPC相当于13代P核?! Lunar Lake处理器深度解析
Meteor Lake是英特尔首款采用Foveros先进封装技术的消费级处理器,这代Lunar Lake依然采用这一技术,但模块数量从Meteor Lake的四个减少到只有两个,从这点就能看出Lunar Lake在设计上与前代产品有很大的不同。从处理器照片来看,Lunar Lake看上去有三个模块,实际上左下角那个模块是单纯用来填充的,里面没有电路。Lunar Lake由计算模块和平台控制模块所组成,它们通过底部的基础模块互相联通。
2024-06-11 15:46:03
76
原创 英特尔至强6评测(Sierra Forest -6780 E、6766 E)
英特尔至强6系列服务器CPU在几周前推出,取代了之前的“可扩展”品牌。该系列有两个芯片系列:提供E核心的Sierra Forest和提供P核心的Granite Rapids。在这次评测中,我们测试了几套早期的Sierra Forest CPU,包括市场领先的拥有144核心的6780E型号。至强6系列CPU旨在支持几乎所有的工作负载,从高性能的AI用例到边缘部署中的较低要求。为了帮助客户理解这两个不同的应用场景,英特尔表示Sierra Forest“针对高密度计算和扩展工作负载中的性能每瓦特进行了优化”
2024-06-06 12:02:29
1034
原创 AMD Instinct加速器系列亮相Computex 2024
AMD董事长兼首席执行官丽莎Su博士在Computex主题演讲中公布了AMD Instinct加速器系列的重大进展。该公司宣布了加速器的扩展多年路线图,承诺每年改进AI性能和内存功能。这标志着人工智能和数据中心工作负载的创新新时代。
2024-06-03 14:11:01
711
原创 TSMC引领先进芯片制造技术:竞速1nm工艺
与台积电的N2 P工艺相比,A16将在相同的正电源电压下提供8-10%的速度提升,在相同速度下降低15-20%的功耗,并为数据中心产品提供高达1.10倍的芯片密度提升。这包括采用新的晶体管设计和材料,以克服量子隧穿效应带来的挑战。N2技术将与台积电NanoFlex一起使用,这是一种设计技术协同优化,为设计人员提供了N2标准电池的灵活性,短电池强调小面积和更高的功率效率,而高电池则最大限度地提高性能。首先,其性能优化的N3P节点即将到来,将于2024年下半年进入量产,并将在一段时间内成为公司最先进的节点。
2024-05-28 17:14:12
481
原创 RTX 4090深度学习性能实测奉上!模型训练可提升60~80%
新一代RTX 4090显卡性能相比上一代RTX 30系列有了巨大提升,最高接近80%,涡轮版RTX 4090显卡尺寸与30系列涡轮版对比变化不大,依旧与超微8卡GPU平台适配,搭配后可以提供强大的整机计算性能。
2023-03-15 17:57:38
6244
1
原创 2022年度回顾之显卡篇 (国产显卡迎来春天,RTX 4090大杀四方)
2022年对于业界来说,上半年和下半年是完全不同的两种市况,一半是海水,一半是火焰。上半年继续受到新冠疫情的影响,以及2020年就已出现的供应短缺问题,PC市场基本延续了去年的态势。不过到了下半年,形势急转直下,行情出现大反转,全球经济衰退危机加剧、加密货币热潮退却、世界大范围出现的通货膨胀,加上地缘政治等因素影响,消费端设备销量出现大滑坡,几乎波及到每一个细分市场。同时库存水平高涨,让不少厂商举步维艰,在年末都进入了寒冬。
2023-01-30 11:17:13
1870
原创 NVIDIA H100 80GB PCIe 动手进行 CFD 仿真
FluidX3D 是一种晶格玻尔兹曼方法 (LBM) 流体求解器,可在每个时间步计算立方网格上所有点的密度和速度。您可能需要查看上面图表的较大版本,但 H100 80GB PCIe 现在位于该图表的顶部。其次是 A100 SXM 80GB,然后是 PCIe A100,然后是 40GB SXM A100。无论如何,这是一个显着的改进。至于功耗,我们认为 68-70W 是相当正常的。310W 的最大功耗似乎有点高,但我们确实在某些 AI 工作负载上达到了这个数字。尽管如此,我们还是想突出莫里茨的工作。
2022-11-21 15:33:03
822
原创 NVIDIA A100 GPU - 推理基准测试分析
运行最先进的文本到图像模型需要什么?游戏卡可以完成这项工作,还是选择A100?如果只有一个 CPU 怎么办?为了阐明这些问题,我们提出了在不同 GPU 和 CPU 上稳定扩散的推理基准。我们的基准测试使用文本提示作为输入并输出分辨率图像512x512。我们使用Huggingface 的扩散器库中的模型实现,并从速度、内存消耗、吞吐量和输出图像的质量方面分析推理性能。
2022-10-14 11:10:23
3001
原创 如何监控和改进用于深度学习的 GPU 使用率?
如果您刚刚为您的下一个很棒的深度学习项目购买了一些漂亮的闪亮 GPU,并且已经开始工作。您可以听到风扇呼呼的声音(或者您可以想象它们在云中某处呼呼),但您如何确保充分利用这些 GPU?下面我们将介绍一些可用于监控 GPU 的工具。检查它们的利用率、温度和内存使用情况。我们将介绍如何安装它们,它们最擅长什么,以及如何使用它们的一些技巧。通过确保充分利用 GPU,您至少可以确保它们尽可能快地运行现有模型(更改模型以使其尽可能高效是另一个话题)。
2022-10-13 17:17:23
2396
1
原创 深度学习服务器怎么选择?
GPU 加速计算可以提供非凡的应用程序性能,能将应用程序计算密集部分的工作负载转移到 GPU,同时仍由 CPU 运行其余程序代码,从用户的角度来看,应用程序的运行速度明显加快。
2022-09-07 17:55:26
862
原创 超微物联网超级服务器IoT SuperServer SYS-210SE-31A 评测
Supermicro IoT SuperServer SYS-210SE-31A追求目标边缘应用。虽然像5G和物联网这样的设备的常见使用案例层出不穷,我们毫不怀疑这一单元将在那里脱颖而出,实际的优势要大得多。边缘AI正在迅速扩张,尤其是在零售业,在零售业,边缘推断是绝对关键的。支持自助结账、客户意图、损失预防,甚至决定将有限的人力资源分配到哪里,这些都是越来越重要的功能。该平台还可以与PCIe存储卡和高速NIC配对,使其成为自动驾驶车辆或灵活SDS平台的可行数据记录盒。......
2022-08-12 16:38:48
344
原创 Supermicro 1024US-TRT 服务器评测:1U 机箱中的 128 个内核
对提高计算密度的推动仍在继续,像 Supermicro 的 1024US-TRT 这样 “A+ Ultra”系列服务器,旨在通过强大的计算能力和丰富的连接选项来响应这一需求。Supermicro 为企业应用、高端云计算、虚拟化和技术计算工作负载中的高密度环境设计了这款纤薄的 1U 双路服务器。该平台支持分布在 32 个 DIMM 上的高达 8TB DDR4 内存,以及大量的 PCIe 4.0 连接、双 10 GbE LAN 端口以及前托架中最多四个 NVMe 设备。.........
2022-08-12 16:03:54
1075
原创 Arm、Intel 和 AMD 服务器 CPU未来2年市场发展分析
本文将讨论主要供应商在 2022-2023 年使用的主要服务器 CPU 意识形态。我们将讨论 Arm、Intel 和 AMD 服务器 CPU 意识形态。
2022-08-05 10:50:42
1339
原创 Compute Express Link CXL 3.0 是令人兴奋的分解构建块
在创建未来数据中心架构时,CXL 3.0 让许多超大规模用户对潜在的成本节约和灵活性感到非常兴奋。
2022-08-05 09:58:59
721
原创 软件RAID与硬件RAID的区别
近年来,企业继续在其存储基础架构中添加基于软件的组件。这包括RAID,以最大限度地提高存储容量并降低数据丢失的风险。而有些企业正在从硬件RAID转向软件RAID阵列。软件RAID和硬件RAID之间的主要区别在于操作系统中的软件管理前者,而独立于操作系统的控制器管理后者。它们在成本、性能和访问速度上也不同。RAID是一种使用多个存储设备(阵列)的虚拟存储资源,它由控制器管理,该控制器链接一个或多个计算设备到阵列。RAID将磁盘作为逻辑存储资源呈现给用户。...
2022-08-02 14:16:09
1451
原创 什么是主机内存缓冲区或 HMB NVMe SSD?
Host Memory Buffer SSD 是一项寻求一个主要目标的行业发展:最大限度地降低 SSD 成本
2022-08-02 10:51:31
2788
原创 CCF 2022:DPU评测技术白皮书发布【附白皮书下载】
本白皮书针对现阶段DPU产品的功能定义,充分考虑DPU使用环境等的差异性,试图为未来DPU产品建立一套公平、开放、全面、客观的DPU评测体系。一方面为DPU用户提供参考,一方面也为未来DPU产品的标准化提供引导。.........
2022-08-01 16:16:47
474
原创 超微物联网超级服务器IoT SuperServer SYS-210SE-31A 评测
SYS-210SE-31A是Supermicro在日益流行的边缘服务器领域的最新产品。有趣的是,这款2单元430mm短深度服务器提供了3个热插拔节点,每个节点都有1个CPU和8个DIMM插槽。
2022-06-17 17:44:54
1653
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人