Ai17316391579-CSDN博客

转载如何制造出比英伟达更好的GPU？

前代CoWoS-R的硅中介层受限于大约两个掩模单元——这正好是Nvidia上周刚刚发布的“Blackwell”B100和B200 GPU的大小，但那个GPU封装使用的是更现代、更不占地方的CoWoS-L技术，该技术制造起来更复杂，就像其他方法中使用的嵌入式桥接。此外，通过移除GPU等设备中的硅中介层或等效物，并转向有机基板，使用更厚的凸点并隔开组件，你可以将带有十几个HBM堆栈的双ASIC设备的制造成本从大约12000美元降低到约6800美元，而芯片加封装的产量从50%提高到87%。

2024-04-24 20:30:52 16

原创【深度解析】企业服务器选择：通用型与定制化，哪个更适合你？

在定制化服务器的选择上，原厂家生产的产品通常能提供更高的品质和更好的服务，是追求高性能和稳定性的企业的理想选择。在这个信息化飞速发展的时代，选择正确的服务器，就是为企业的未来发展打下坚实的基础。同时，也建议企业在选择服务器时，咨询专业的IT顾问，以获得更专业的建议和服务。在定制化服务器的选择上，原厂家生产的服务器以其严格的生产测试流程和完善的售后服务体系，为用户提供了更强的品质保障和技术能力。当企业面临科学计算、大数据分析等高端应用需求时，定制型服务器以其灵活的配置和卓越的性能，成为了不二之选。

2024-04-24 10:07:08 603

转载 2024年4月起，英伟达H100\A100芯片倒爷们，玩不动了?

我看着这个西装下穿着运动鞋、风尘仆仆的80后男人，他看起来真诚、老实，微微含着肚腩，给人一种腼腆的感觉，只有瞳孔因为兴奋而明显放大——我突然相信了，他刚才告诉我他老板说他炒芯片时的状态——“阿诚啊，你一炒芯片就眼睛发光，肯定是要发大财哇。诚哥在那几天几乎疯狂，不需要吃饭，也不会疲劳，只要在呼吸，就可以卖卡。其中两种可以订购中国特供版的官方渠道：一条通过英伟达自己的经销商体系，一条通过英伟达认证过的服务器大厂经销商体系，这两条渠道上挤满了排队下单的大厂，交付的时间则取决于英伟达，最快也要到2023年底。

2024-04-19 20:40:46 66

转载高性能GPU服务器AI网络架构（下篇）

对于采用NVLink3技术、每条通道带宽为50GB/s的A100 GPU，在全互联结构中，每条线路的总带宽为12 * 50GB/s = 600GB/s。需要注意的是，此带宽是双向的，既支持数据发送也支持接收，因此单向带宽为300GB/s。因此，在全互联结构中，每条线路的总带宽变为8 * 50GB/s = 400GB/s，单向带宽为200GB/s。同一主机内GPU与其各自网络接口卡（NIC）之间的通信：采用PCIe Gen4交换芯片，双向带宽为64GB/s，单向带宽为32GB/s。

2024-04-11 11:02:18 58

转载 2024生信计算100+ 数据库：涉及蛋白、代谢、GWAS、动植物、病毒、细菌...

以上内容来自生信益站。

2024-04-11 09:58:14 15

转载高性能GPU服务器AI网络架构（上篇）

例如，在探讨H100时所展现的设计，GPU直接与其搭载的HBM内存相连，无需再经过PCIe交换芯片，从而极大地提高了数据传输速度，理论上可实现显著的数量级性能提升。而在诸如PCIe、内存、NVLink及HBM等其他硬件组件中，带宽指标则通常使用每秒字节数（Byte/s）或每秒事务数（T/s）来衡量，并且这些测量值一般代表双向总的带宽容量，涵盖了上行和下行两个方向的数据流。因此，在比较评估不同组件之间的带宽时，准确识别并转换相应的带宽单位至关重要，这有助于我们全面理解影响大规模GPU训练性能的数据传输能力。

2024-04-07 11:55:49 63

原创大模型训练推理如何选择GPU？一篇文章带你走出困惑（附模型大小GPU推荐图）

对于预算有限的用户，可以选择性价比较高的V100 32G或A800/H800等型号的GPU。它采用了先进的Ampere微架构，具备强大的浮点运算能力和高效的内存带宽，能够满足大模型训练推理的高计算需求。此外，还需要考虑GPU的散热性能，以确保在高负载运行时能够保持稳定的温度。这类配置不仅能够满足大规模模型的训练需求，还能提供优秀的推理性能，为用户带来流畅的使用体验。服务器，入围政采平台，H100、A100、H800、A800、L40、L40S、RTX6000 Ada，RTX A6000，

2024-04-03 16:39:37 934

转载 A100/H100/GH200集群：网络架构及光模块需求

由于NVLink 4.0对应互联带宽双向聚合是900GB/s，单向为450GB/s，则256卡的集群中，接入层总上行带宽为115200GB/s，考虑胖树架构以及800G光模块传输速率（100GB/s），800G光模块总需求为2304块。RSC项目第二阶段，Meta总计部署2000台A100服务器，包含16000张A100 GPU，集群共包含2000台交换机、48000条链路，对应三层CLOS网络架构，若采用全光网络，对应9.6万个200G光模块，即A100:光模块=1:6，与前文测算的A100架构相同。

2024-03-21 16:51:12 248

转载紧跟“智算中心”这波大行情！人工智能引领算力基建革命！

，

2024-03-21 14:40:47 24

转载 Nvidia B100/B200/GB200 关键技术解读

B200 GPU的晶体管数量是现有H100的两倍多，但B200封装了2080亿个晶体管（而H100/H200上为800亿个）。这意味着B200芯片封装密度比H100进一步提高，对管理散热和功耗也提出了更高的要求。引入一种新的计算精度，位宽比FP8进一步降低，B200峰值算力达18P。位宽介于FP4和FP8之间。B200有两个Die，高速连接通道NV-HBI达到10TB/s。两个Die是一个统一的Cuda GPU。NV-HBI会占用一定的芯片面积。

2024-03-20 13:50:04 777

转载 AI核弹B200发布：超级GPU新架构30倍H100单机可训15个GPT-4模型，AI进入新摩尔时代

30 倍 AI 算力是如何做到的？现在，英伟达的 NVLink Switch Chip 可以让所有这些芯片互联起来，全速运转没有瓶颈（1.8TB/s，几乎比上代快 10 倍），并帮助构建了 DGX GB200 NVL72。，GR00T 驱动的人形机器人能够接受文本、语音、视频甚至现场演示的输入，并对其进行处理以采取特定的操作，包括理解自然语言、模拟人类行为、在现实世界中导航和交互。就比如英伟达的「大客户」OpenAI，一直在使用自己的 AI 模型来为一家名为 Figure 的初创公司的人形机器人提供支持。

2024-03-20 08:42:47 61

转载 HBM、HBM2、HBM3和HBM3e技术对比

三大存储原厂主要承担DRAMDie的生产及堆叠，展开技术升级竞赛，其中SK海力士与AMD合作发布全球首款HBM，23年率先供应新一代HBM3E，先发奠定市场地位，主要供应英伟达，三星供应其他云端厂商，根据TrendForce数据，2022年SK海力士市占率50%、三星市占率40%、美光市占率10%左右，2023年SK海力士市占率预计为53%，三星市占率38%、美光市占率9%。，作为GDDR竞品，为4层die堆叠，提供128GB/s带宽，4GB内存，显著优于同期GDDR5。以上内容来自智能计算芯世界。

2024-03-01 15:26:08 294

转载一场AI“革命”开始，OpenAI文生视频模型Sora

不同于此前许多AI大模型文生图或视频时，会出现人物形象前后不一致等问题，此次OpenAI展示的Sora生成的视频中的主角、背景人物，都展现了极强的一致性，可以支持60秒一镜到底，并包含高细致背景、多角度镜头，以及富有情感的多个角色，可谓是相当的“炸裂”。可以说，目前的Sora已经拥有了足以改变视频广告行业的能力，如果持续迭代，并在保持稳定性和一致性的前提下，进一步支持更复杂的交互、更长的视频时长，并加入更为丰富的AI视频编辑功能，必将对于现有的影视制作产业带来革命。Sora还能模拟人工过程，如视频游戏。

2024-02-20 15:31:42 113

转载 2024年最新：一文看懂英伟达显卡B100、H200、L40S、A100、A800、H100、H800、V100如何选择，附架构技术和性能对比

Ampere 架构的 GPU 采用了多个[流多处理器]（SM）和更大的总线宽度，提供了更多的 CUDA Core 和更高的频率。而受到影响较大的还是 NVlink 上的削减，但是因为架构上的升级，虽然比不上同为 Hopper 架构的 H100，但是比 ampere 架构的 A800 还是要强上不少的。NVIDIA 通常用最小的运算单元表示自己的运算能力，CUDA Core 指的是一个执行基础运算的处理元件，我们所说的 CUDA Core 数量，通常对应的是 FP32 计算单元的数量。

2024-02-03 17:15:45 670

转载数据中心：CPU空间巨大，国内厂商份额却极低

主频是 CPU 的时钟频率，即 CPU 的工作频率，一般来说，一个时钟周期完成的指令数是固定的，所以主频越高，CPU单位时间运行的指令数越多。外频即CPU和周边传输数据的频率，具体是指 CPU 到芯片组之间的总线速度，CPU 的外频决定着整块主板的运行速度。CPU 的生产需要经过硅提纯、切割晶圆、影印、蚀刻、分层、封装、测试 7个工序，制程工艺的提升或更小的制程对于 CPU 性能的提升影响明显，主要表现为 CPU 频率提升以及架构优化两个方面。以上内容来自智能计算芯世界。

2024-01-25 12:18:22 90

转载互联：高性能计算的“革命之路”

NVLink Switch（NVS）则是基于NVLink的互联网络的组成部分，可以实现多个服务器中的GPU直联，NVS不但绕开了服务器内PCIe互联，还绕开了服务器间的以太网通讯，使得跨服务器的GPU通讯路径从原来的6步省略到2步，极大的降低了GPU通讯延迟，从而增强AI大模型计算中数据同步的效率，为AI大模型的计算提供了跨服务器集群解决方案。与此同时，专用的互联芯粒技术也在崛起。同时，集成die-to-die 3D接口，Cache等模块，以实现更高效的垂直互联，最大程度的减少存储本身带来的延迟和功耗。

2024-01-25 10:42:25 151

转载 2024年了，国产GPU，可堪大用吗？

作为计算机的图形处理以及并行计算内核，GPU最基本的功能是图形显示和分担CPU的计算量，主要可以分为图形图像渲染计算 GPU和运算协作处理器 GPGPU（通用计算图形处理器），后者去掉或减弱GPU的图形显示能力，将其余部分全部投入通用计算，实现处理人工智能、专业计算等加速应用。上述负责人认为，国产GPU业应采取开放合作的心态，学会站在巨人的肩膀上，善于利用现有架构和生态，设计契合市场需求的优秀产品，打造全球化设计水平的开发团队。在他看来，国产GPU在起步阶段兼容现有生态更容易发展，先求生存；

2024-01-13 18:31:40 202

转载英伟达 vs. 华为海思：GPU性能一览

NVIDIA NVLink采用全网状拓扑，如下所示，（双向）GPU-to-GPU 最大带宽可达到400GB/s （需要注意的是，下方展示的是8*A100模块时的600GB/s速率，8*A800也是类似的全网状拓扑）；本文转自SDNLAB，编译自arthurchiao的博客，主要介绍了英伟达和华为/海思主流 GPU 的型号性能，供个人参考使用，文中使用数据均源自官网。以上内容来自架构师联盟。

2023-12-31 17:11:21 1717

转载重磅！英伟达正式发布GeForce RTX 4090D，你想知道的都在这里

据英伟达官方公布的评测数据显示，在启用DLSS和光线追踪模式下，在游戏《巫师3：狂猎》中，GeForce RTX 4090D的性能约为GeForce RTX 3090 Ti的2.2倍，在游戏《心灵杀手2》中，约为3.5倍，在游戏《瑞奇与叮当：时空跳转》和《蜘蛛侠：迈尔斯莫拉莱斯》中，约为1.9倍。对此英伟达方面提供了一些GeForce RTX 4090D对比数据，但是，所参考对比的型号并非GeForce RTX 4090，而是上一代的GeForce RTX 3090 Ti。

2023-12-30 19:37:14 184

转载 2023年服务器计算机CPU行业报告

纵向对比看，同样以龙芯为例，其第二代产品3A2000在没有提升主频的前提下，通过设计能力的改进，性能提升了2.5倍；以龙芯中科招股说明书中公布的2021年中国CPU设计企业各上市公司毛利率为例，最大值为景嘉微的63.24%，最小值为北京君正的36.10%，最大值和最小值之间的差距超过27个百分点，而中值为46.72%。，中国芯片国产化率低，在2020年该指标仅为16%，且主要集中在28nm级别以上的中低端芯片，高端芯片的渗透率低，14nm/16nm级别以下的芯片大多由台积电、AMSL等境外厂商代工。

2023-12-30 18:39:01 183

转载常用生信软件汇总（附部分高校生物信息学中心）

以上内容来自 CSDN博主「wangchuang2017」部分中国高校生物信息学中心。

2023-12-28 18:34:51 102

转载内网穿透详解

阅读本文前需要先搞懂NAT、PAT、端口映射几个概念，前面我有写了一篇关于这几个概念的博文。根据之前的博文我们已经知道，内网宽带中的主机可以访问公网宽带主机，反之不可以访问；公网宽带主机可以和公网宽带主机双向访问；内网宽带中的主机和内网宽带中的主机互相无法访问。那么内网宽带中的客户机和公网宽带中的客户机如何访问另一个内网宽带中的服务器呢？这里就需要用到内网穿透技术。

2023-12-28 18:28:39 82

转载李航：对 LLM语言大模型的若干观察和思考

这一点与其他的机器学习有本质的不同。其基本想法是，先训练一个基于 Transformer 的大规模语言模型，在其基础上通过有监督的微调 SFT 方法，学习序列到序列模型，把自然语言的理解和生成任务都转化为序列到序列生成的任务，在一个模型上实现所有的任务，包括生成式对话。而大规模语言模型，由于学习手段和规模，其生成的自然语言所描述的内容，在现实中是很容易发生的，甚至是合理的，幻觉现象也得到比较有效的控制。心智（mind）是我们每个人体验的内心的感知和认知，既有意识的部分又有下意识的部分，主要是意识层面的。

2023-10-23 16:19:46 75

转载星闪的 “ 遥遥领先 ”

不仅能利用现有数据，还可以通过对环境的探索获得新数据，并利用新数据循环往复地更新迭代现有模型的机器学习算法。在传输速率上，星闪是碾压蓝牙的，至于更快的 WiFi 6 和 7，现在的普及率又有多少呢？并且两者独立发展了几十年，在各自的道路上渐行渐远，消费者们曾经期盼的 “ 蓝牙-WiFi ” 互联终究没有到来。而某些大厂私有蓝牙能达到 15 毫秒的延迟，Wi-Fi 目前的延迟最低为 10 毫秒。而目前最新的蓝牙最大连接数是 8 台，Wi-Fi7 是 256 台。但是星闪的领先是 “ 革命性 ” 的。

2023-09-28 10:09:42 313

转载比黄金更贵的显卡，疯狂H100

华尔街和硅谷联袂奉上了一件震撼业界的大事：让一家创业公司拿到23亿美元的债务融资，抵押物则是当前全球最硬的通货——。这个大事件的主角叫做CoreWeave，主营业务是AI私有云服务，简单说就是通过搭建拥有大量GPU算力的数据中心，来给AI创业公司和大型商业客户提供算力基础设施。CoreWeave累计融资5.8亿美金，目前是B轮，估值20亿美元。CoreWeave成立于2016年，创始人是三个华尔街大宗商品交易员。刚开始公司的主营业务只有一个：挖矿，采购大量GPU来组建矿机中心，

2023-09-08 10:02:30 207

转载一文看懂英伟达A100、A800、H100、H800各个版本有什么区别？

虽然对于这些国产AI芯片厂商来说，美国的新的AI芯片限制政策是一个利好消息，但是对于国内依赖于高性能AI芯片提供AI硬件的厂商、以及提供AI服务的互联网厂商及一些AI技术厂商来说则是一个利空，毕竟如果缺少了强大的AI芯片的支撑，那么其AI技术的发展及所能够提供的AI服务也将受到负面影响。，在目前供需失衡不正常的市场情况下，市面大部分商家是无法供应的，甚至提供不属实的信息，如果是科研服务器的话首选风虎云龙科研服务器，入围政采，品质和售后服务都有保障。，其中就包括了对于高性能计算芯片对中国大陆的出口限制。

2023-09-01 16:51:26 4272 2

转载详解-英伟达H100 GPU：供需

但是，如果您关心成本或使用已有的基础设施，这不是一个严格的要求。例如，硬件方面的TPU，Inferentia，LLM ASIC和其他产品，以及软件方面的Mojo，Triton和其他产品，以及使用AMD硬件和软件的样子。但例如，Azure说“嘿，我们希望Inflection使用10，000个H100”与Azure说“嘿，我们希望Azure的云使用10，000个H100”是不同的 - Nvidia关心谁是最终客户，因此如果Nvidia对最终客户感到兴奋，云可能能够为特定的最终客户获得额外的分配。

2023-08-30 10:20:06 374

转载总结一下截止2023年中旬全球主要厂商拥有的GPU数量以及训练GPT-3/LLaMA2所需要的GPU数量

A100\H100在中国大陆基本上越来越少，A800目前也在位H800让路，如果确实需要A100\A800\H100\H800GPU，建议就不用挑剔了，HGX 和 PCIE 版对大部分使用者来说区别不是很大，有货就可以下手了。无论如何，选择正规品牌厂商合作，在目前供需失衡不正常的市场情况下，市面大部分商家是无法供应的，甚至提供不属实的信息，如果是科研服务器的话首选风虎云龙科研服务器，入围政采，品质和售后服务都有保障。DGX H100 = Nvidia官方的H100服务器，配备8个H100 GPU。

2023-08-29 16:00:51 223

转载 NVIDIA最新发布L40S通用GPU，为数据中心赋予出色的 AI 和图形性能

以及搭载该 GPU 的 OVX 服务器系统，这款计算加速显卡可以用于图形渲染、人工智能大模型训练和推理、三维设计和视频处理等用途，AI 运算性能高于 A100 GPU。英伟达声称，L40S 的生成式 AI 推理性能比 A100 高 1.2 倍，训练性能高 1.7 倍，英伟达表示，对于“具有数十亿个参数和多种数据模式的复杂 AI 工作而言”，L40S 的效能更加突出。英伟达同时表示，华硕、戴尔、技嘉、HPE、联想、QCT 和美超微等厂商，将“很快推出”搭载 L40S GPU 的 OVX 服务器系统。

2023-08-26 17:03:49 521

转载 NVIDIA DGX 与 NVIDIA HGX 有什么区别

这些包括更密集的解决方案、用于更多内核的基于 AMD 或 ARM 的 CPU 解决方案、不同的 Xeon SKU 级别、不同的 RAM 配置、不同的存储配置，甚至不同的 NIC。NVIDIA 还有其他主板，例如称为 Redstone 和 Restone Next 的 4x GPU 组件，但主要的 DGX/HGX (Next) 平台是使用 SXM 的 8x GPU 平台。对于最新一代的“Hopper”，散热器必须变得更高，以适应更高功率的 GPU 以及更高性能的 NVSwitch 架构。

2023-08-16 10:31:26 538

转载 “常温超导体”究竟是啥？若实现世界会发生什么改变

目前，计算器与消费电子的技术与材料创新，都是为了要实现高速计算、高频高速传输、小型化等要求，而超导特性将会颠覆既有的产品设计与材料、技术，如：不再需要散热系统、光纤/高端CCL（铜箔基板）被取代、先进制程门槛降低等，让即便是小如iPhone的移动装置，都能拥有与量子计算机匹敌的运算能力，能量利用的效率直接上天了。再者，超导将推进可控核聚变的研究。目前，可控核聚变还很难实现，科学家研究的方向，主要就是在核聚变的周围，用巨大的磁场，约束住爆炸产生的各种高能粒子，然后缓慢释放，这样就能做到加以利用。

2023-08-07 14:41:40 134

原创科研HPC中哪些科学计算适合GPU计算，哪些适合CPU计算？

TensorFlow、PyTorch、Keras、Caffe等，多数情况下机器学习和深度学习不需要依赖CPU的计算能力，有GPU进行加速计算就可以了，但仍有一部分需要依赖CPU的计算能力，对CPU的核心和主频有一定要求。GPU加速计算通常需要对代码进行特殊的优化和并行化处理，而且虽然GPU的运算速度相对于CPU的速度更快，但内存容量和计算能力相对较弱，因此在使用GPU加速计算时需要考虑到应用程序的特点和计算需求。密码学涉及到大量的加密和解密计算，其中一些计算可以通过GPU加速来提高加解密速度和安全性。

2023-07-21 10:02:44 298

转载详情：揭秘A100、A800、H800、V100在HPC与大模型训练中的霸权

这台超级计算机基于英特尔的CPU和GPU，预计在今年晚些时候上线，将提供超过2 exaflops的FP64浮点性能，超越美国能源部橡树岭国家实验室的"Frontier"，有望成为全球第一台理论峰值性能超过2 exaflops的超级计算机。考虑到全球近3亿的Office 365用户数量，中国大公司如果想利用大型模型创造更多服务，并支持其他客户在云上进行更多大型模型的训练，就需要提前储备更多的GPU资源。同时，在模型分发和运行过程中，提供全面的账号认证和日志审计功能，全方位保障模型和数据的安全性。

2023-07-13 11:20:43 883 1

转载 GPU平台生态：英伟达CUDA和AMD ROCm对比分析

每个 CUDA 块由一个流式多处理器（SM）执行，不能迁移到 GPU 中的其他 SM，一个 SM 可以运行多个并发的 CUDA 块，取决于CUDA 块所需的资源，每个内核在一个设备上执行，CUDA 支持在一个设备上同时运行多个内核。相较于持续迭代的微架构带来的技术壁垒硬实力，成熟的软件生态形成的强大用户粘性将在长时间内塑造 GPU厂商的软实力。OpenCL 支持多种编程语言和环境，并提供丰富的工具来帮助开发和调试，可以同时利用 CPU、GPU、DSP 等不同类型的加速器来执行任务，并支持数据传输和同步。

2023-07-06 11:52:58 1011

转载 2023基因测序、生物信息分析平台工作站、服务器计算集群硬件配置推荐

如果要进行从头组装（例如Velvet），假设一个人的全基因组测序数据，采用二代测序的方法，人的基因组3G，10倍数据30G，那么这30G的碱基，在切成更小的kmer，假设数据增加到了100G，还不算存储序列的一些其他信息，序列拼接的时候必须一次将所有数据同时存入内存，如果内存达不到100G，拼接根本无法完成。生物信息学的研究材料和结果就是各种各样的生物学数据，其研究工具是计算机，研究方法包括对生物学数据的搜索（收集和筛选）、处理（编辑、整理、管理和显示）及利用（计算、模拟）。全基因组装配/组装？

2023-07-06 08:58:22 365

原创 Intel还跟得上吗？Zen5单颗192核心384线程1.5GB三级缓存CPU来啦

每个CCD内集成8个核心、32MB三级缓存，单颗处理器最多16个CCD，比现在增加4个，核心总数达到128个(256线程)，三级缓存总量多达512MB。将继续在每个CCD上堆叠64MB 3D缓存，总量1024MB，再加上原生的512MB，三级缓存总量多达1536MB，也就是1.5GB！Zen5c架构，单个CCD核心数翻番到16个，三级缓存还是32MB，总计12个CCD，组成192核心384线程、384MB三级缓存。Zen 5对应的处理器产品，有三个代号已经浮出水面，分别是EPYC Turin 7xxx，

2023-07-05 12:21:44 155

转载 2023基因测序、生物信息分析平台工作站、服务器计算集群硬件配置推荐

如果要进行从头组装（例如Velvet），假设一个人的全基因组测序数据，采用二代测序的方法，人的基因组3G，10倍数据30G，那么这30G的碱基，在切成更小的kmer，假设数据增加到了100G，还不算存储序列的一些其他信息，序列拼接的时候必须一次将所有数据同时存入内存，如果内存达不到100G，拼接根本无法完成。生物信息学的研究材料和结果就是各种各样的生物学数据，其研究工具是计算机，研究方法包括对生物学数据的搜索（收集和筛选）、处理（编辑、整理、管理和显示）及利用（计算、模拟）。全基因组装配/组装？

2023-06-29 10:35:10 101

原创深度学习选择GPU的12条建议！

如果你可以为你的集群购买 RTX GPU：66% 的 8路RTX 4080 和 33% 的 8路RTX 4090（要确保能有效地冷却）。如果解决不了 RTX 4090 的冷却问题，那么可以购买 33% 的 RTX 6000 GPU 或 8路Tesla A100。任何专业绘图显卡（如Quadro 卡）；进一步学习，卖掉你的 RTX 4070，并购买多路RTX 4090。根据下一步选择的领域（初创公司、Kaggle、研究、深度学习应用），卖掉你的 GPU，三年后再买更合适的（下一代 RTX GPU）。

2023-05-26 09:40:07 1471

原创 GPU服务器有什么作用？如何正确挑选？

一般来说车载GPU服务器最重要的技术指标是高低温指标，机载GPU服务器最重要的技术指标是震动指标（冲击震动或均速震动），船舶GPU服务器最重要的技术指标是三防指标（盐、雾、霜），弹载GPU服务器要求的技术指标是就更全面啦！液冷GPU服务器和水冷GPU服务器最大的不同点是散热的方式不同。水冷服务器散热方式是水（水的热效比目前是优于液体的热效比），但水有导电的通用性，所以水冷服务器目前还没有在市上大量应用，液冷GPU服务器则不同，液冷GPU服务器是综合热效比、导热比、可靠性等各项指标技术的综合性技术的产物。

2023-04-04 10:37:56 470

原创国产AI服务器分类、技术及产品（2023）

目前国产服务器主要品牌也就是浪潮、曙光、华为、超聚变、新华三、联想、风虎（科研服务器风虎信息、风虎云龙），也还有很多其他品牌，外国品牌惠普、戴尔、IBM等在国内还有不小的份额，其实核心部件大家都一样，选国产的更划算。说明： 1、华为、超聚变已经为两家，超聚变以X86架构服务器为主，华为在走自研处理器服务器，主要为鲲鹏、昇腾系列；2、科研服务器往往是众多应用的基础、涉及科研方向、领域较宽，特别是不同软件特征和使用环境，要求团队要有相当的专业经验，科研服务器是各类应用场景的先导和基础。AI服务器采取GPU架构，

2023-04-03 19:53:26 2626 1

空空如也

空空如也