自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 收藏
  • 关注

原创 BGP选路规则-华为

如果路由携带Originator_ID属性,选路过程中将比较Originator_ID的大小(不再比较Router ID),并优选Originator_ID最小的路由。如果路由携带Originator_ID属性,选路过程中将比较Originator_ID的大小(不再比较Router ID),并优选Originator_ID最小的路由。优选本地生成的路由(本地生成的路由优先级高于从邻居学来的路由)。对于公私网互引的路由和本地收到的路由,优选本地收到的路由。

2026-04-26 00:23:55 337

原创 华为数据中心交换机芯片的介绍

维度华为 (Solar + AI)传统方案 (商用芯片)核心优势软硬协同、智能无损标准化、生态开放AI 训练效率100%(通过 AI 芯片实现 0 丢包)~60-80%(受限于传统以太网拥塞)灵活性极高(全可编程,快速适配新协议)受限(依赖芯片厂商发布新版本)供应链自主可控(全栈自研)依赖外部(博通/Marvell)华为的数据中心交换机芯片战略,不是单纯追求“带宽第一”,而是通过Solar 交换芯片提供高性能基座,再通过内嵌 AI 芯片注入智能。

2026-04-22 01:44:06 442

原创 英伟达(NVIDIA)数据中心交换机芯片的介绍

搞。

2026-04-22 01:26:48 350

原创 盛科网络数据中心交换机芯片的介绍

搞。

2026-04-22 00:45:27 495

原创 Marvell(美满电子)数据中心芯片介绍

搞。

2026-04-21 00:03:57 545

原创 博通(Broadcom)数据中心交换机芯片的介绍

要。

2026-04-20 00:04:31 414

原创 小白如何配置华为云的安全WAF

好嘞!既然前面的​ 都搭好了,现在咱们给这套架构穿上。

2026-04-15 00:31:51 229

原创 小白如何配置华为云的ELB

再接上篇VPC,既然地基(VPC)和网络道路(子网)都铺好了,接下来就该立起了。简单来说,ELB 的作用就是把成千上万的外部访问请求,均匀地分发给后端的多台服务器,既防止单台机器被挤爆,又能在某台机器挂掉时自动把流量切走,保证业务“零中断”。。

2026-04-14 00:24:57 207

原创 小白如何配置华为云的VPC

在华为云上,VPC(虚拟私有云)的配置逻辑与刚才提到的通用框架一脉相承,但在具体操作页和命名习惯上,华为云有自己的“方言”。为了让你一次配通,我把华为云上最常见的配置场景()拆解为四个关键步骤。

2026-04-14 00:17:13 294

原创 安全服务:WAF/HSS

您提到的“WAF/HSS”通常指两种主流的云安全服务:Web应用防火墙(WAF)和主机安全服务(HSS)。它们分工明确,前者守护网络边界,后者加固主机内部,通常建议组合使用以构建纵深防御体系。

2026-04-07 23:26:22 153

原创 存储:OBS/EVS 、SFS

在实际项目中,这三种存储服务通常不是互斥的,而是协同工作,共同构建一个完整的存储架构。ECS云服务器:使用EVS​ 作为系统盘和运行应用的本地高速数据盘。用户上传的图片/视频:直接存储到OBS​ 中,并通过CDN加速访问。多台Web服务器需要共享配置文件或静态资源:挂载一个SFS​ 文件系统。希望这个解释能帮助您清晰地区分和理解OBS、EVS和SFS。如果您有更具体的应用场景,我可以为您提供更精准的选型建议。

2026-04-07 23:24:25 231

原创 容器:CCE /SWR

特性SWR (容器镜像仓库)CCE (云容器引擎)核心角色​存储、分发镜像运行、管理容器类比​仓库、货架、行李箱运输车、工厂、舞台主要操作​pullcreate解决的问题镜像放在哪里?如何安全地分发?容器在哪里运行?如何编排和伸缩?依赖关系​为 CCE 提供“原材料”(镜像)从 SWR “获取原材料”并运行总而言之,SWR 负责“存”,CCE 负责“跑”。两者结合,使得在华为云上构建、部署和运维容器化应用变得高效且可靠。

2026-04-07 23:01:02 236

原创 计算:ECS/IMSS/AS

算价值:通过量化风险降低额,证明 IAM 的投资回报率 (ROI)。算效率:通过对比自动化前后的工时,展示 IAM 带来的生产力提升。算合规:通过计算覆盖率、合规率等指标,评估安全水位。通过这些“计算”,你可以清晰地向管理层或团队展示 IAM 系统的重要性与建设成果。AS (Auto Scaling / 弹性伸缩)​ 是实现云计算“弹性”的关键组件。它负责自动调整计算资源(通常是 ECS 实例的数量)以应对业务负载的变化。ECS​ 提供了弹性的计算能力。IMSS (IAM)​ 保障了弹性的安全与权限。

2026-04-07 22:58:49 272

原创 云网络探索

✅ 允许同租户 VM 之间任意通信✅ 允许 ICMP✅ 允许 TCP 80(HTTP)❌ 拒绝 TCP 23(Telnet)❌ 拒绝来自 VLAN 20(租户 B)

2026-04-03 00:29:58 423

原创 VXLAN结合OVS的多VIN场景

目标:同一对物理主机每个租户一个租户内 VM 可跨主机通信不同租户。

2026-04-03 00:14:57 198

原创 VXLAN结合OVS的场景

VXLAN 和 OVS(Open vSwitch)结合,是的典型方案:OVS 负责在宿主机上“虚拟出交换机 + 隧道端点(VTEP)”,用 VXLAN 把不同宿主机的虚拟网络打通,实现多租户、跨节点的大二层网络。下面分几个部分说清这个组合。

2026-04-03 00:02:11 258

原创 VXLAN(Virtual eXtensible LAN,虚拟可扩展局域网)技术

VXLAN(Virtual eXtensible LAN,虚拟可扩展局域网)是一种,主要用来突破传统 VLAN 的规模限制,并让云网络、多租户网络更容易做大规模、跨数据中心的扩展。下面分几个点帮你把 VXLAN 说透。

2026-04-02 23:50:05 269

原创 SDN(Software-Defined Networking,软件定义网络)

SDN(Software-Defined Networking,软件定义网络)是一种的网络架构思想。它的核心目标是:让网络像软件一样可编程、可自动化、可快速变更。下面从概念、架构、关键技术、云中的应用和优缺点几个方面帮你梳理清楚。

2026-04-01 23:55:57 281

原创 Open vSwitch (OVS)

​ 是一个开源的虚拟交换机软件,专为虚拟化环境设计,旨在为虚拟机(VM)或容器提供灵活、可编程的网络连接。

2026-04-01 00:30:29 251

原创 芯片设计的调度方式

维度说明调度对象​任务、线程、数据、计算单元、通信请求等调度层次​应用层、编译器层、微架构层、NoC 层等调度策略​静态 / 动态、优先级、轮询、最短任务优先、空间/时间映射等目标​提升性能(吞吐、延迟)、资源利用率、能效、实时性、公平性挑战​并发控制、资源竞争、依赖关系、异构性、动态不确定性。

2026-03-30 23:18:23 264

原创 芯片设计流控机制

维度说明目的​防止数据丢失、缓冲区溢出,保障通信可靠性和效率核心问题​发送方速度 vs 接收方处理能力 / 缓冲区容量 的匹配常见机制​握手控制、Credit-Based、Buffer管理、速率限制、优先级调度、反馈控制等应用范围​片上总线、NoC、存储接口、高速互连、AI芯片内部通信等设计目标​可靠性 + 吞吐量 + 延迟 + 公平性 + 实时性的平衡设计原则说明数据搬运不能成为瓶颈​计算单元的速度远高于访存速度,必须通过预取、缓存、并行搬运保障数据供给流控是数据搬运的“红绿灯”​通过。

2026-03-29 23:09:38 249

原创 芯片的封装技术演进了解

维度2D 封装​2.5D 封装​3D 封装​芯片排列方式​单颗芯片平铺在基板上多颗芯片并排放置在中介层上(平面排列)多颗芯片垂直堆叠(Z轴方向)互连方式​引线键合(Wire Bond)中介层布线(Interposer RDL),通过微凸点/倒装焊连接TSV(硅通孔)实现芯片间垂直互连​互连密度​低高(中介层布线密度远高于基板)极高(TSV + 微凸点,间距可达几十微米以下)集成度​低中高极高(芯片立体堆叠,节省空间)性能 / 延迟​一般,信号路径较长高带宽,延迟较低最佳。

2026-03-27 23:34:44 268

原创 mlag组网组网不需要配置monitor-link?

配置 monitor-link 后:上行 DOWN → 自动 shutdown 下行 MLAG 口,避免异常。纯 MLAG 核心组网本身不依赖 monitor-link 运行。- MLAG 依靠 peer-link + 双主检测/心跳 实现双设备冗余。- 当 MLAG 设备上行口/上联链路断开,但 peer-link 正常。- 纯二层 MLAG 互联、无上行风险:可以不配 monitor-link。- 正常场景下,无需 monitor-link 也能正常转发、倒换。- 接入层 MLAG 上联到核心。

2026-03-26 07:59:50 32

原创 芯片MPW和Full Mask

摘要:FullMask和MPW是两种芯片制造技术。FullMask为每层电路单独制作掩膜版,适合大批量生产,具有高效率和高良率,但成本昂贵。MPW技术通过共享掩膜版降低成本,适用于小批量生产和研发,但周期较长且良率可能受影响。FullMask流程包括设计、材料选择、成型等环节,强调质量控制;MPW则需符合设计规则并等待固定生产周期。选择建议:量产选FullMask,研发和小批量选MPW更经济。(149字)

2026-03-25 23:06:57 417

原创 800G光模块的现状

OSFP-800G-2FR4 是一种高速光模块,采用 OSFP(Octal Small Form-factor Pluggable)封装形式,支持 800G 以太网传输。该模块通常用于数据中心和高性能计算网络,提供高带宽和低延迟的连接解决方案。OSFP-800G-2VR4 是一种高速光模块,采用 OSFP(Octal Small Form-factor Pluggable)封装形式,支持 800G 数据传输速率。该模块通常用于数据中心和高性能计算场景,满足高带宽、低延迟的需求。

2026-03-12 00:28:30 513

原创 400G光模块介绍

400G光模块是用于高速数据传输的光通信器件,支持400Gbps(千兆比特每秒)的传输速率,广泛应用于数据中心、5G网络和云计算等领域。其核心功能是将电信号转换为光信号(或反向转换),以满足高带宽、低延迟的通信需求。400G QSFP-DD(Quad Small Form Factor Pluggable Double Density)是一种高密度、高速率的光模块封装形式,专为400G以太网和数据中心应用设计。其核心特点是双排触点设计,支持更高的数据传输速率和更低的功耗。

2026-03-10 00:06:34 455

转载 什么是InfiniBand(IB)网络

InfiniBand(IB)是一种高性能网络通信标准,采用RDMA技术,具有高吞吐量、低延迟和高可靠性,广泛应用于数据中心、HPC和AI领域。其发展始于2000年,由IBTA联盟推动,以色列公司Mellanox成为技术领导者(2019年被英伟达收购)。IB协议采用分层架构(物理层至传输层),支持无损传输和动态流控技术。带宽从SDR演进至XDR(800G),光模块也同步升级至800G。主要产品包括交换机(如NVIDIA Quantum-2)、网卡(ConnectX-7)及专用线缆(DAC/AOC)。IB网络现

2025-12-15 23:45:15 529

转载 什么是RDMA技术及其三个协议

本文介绍了DMA和RDMA两种内存访问技术。DMA(直接内存访问)通过专用控制器使外设直接访问内存,减少CPU负担。RDMA(远程直接内存访问)进一步实现跨计算机的直接内存访问,绕过操作系统内核,提高传输效率。文章分析了RDMA的三种实现协议:InfiniBand(高性能但成本高)、RoCE(基于以太网的成本优化方案)和iWARP(基于TCP/IP,可靠性高但性能较低)。这些技术通过减少CPU参与数据传输,显著提升了系统性能,但各有适用场景和优缺点。

2025-12-15 23:32:13 296

转载 什么是RoCE网络

RoCE网络技术解析:以太网上的高性能RDMA解决方案 RoCE(RDMA over Converged Ethernet)是一种基于以太网的远程直接内存访问技术,通过优化以太网协议实现低延迟和高吞吐量数据传输。文章详细介绍了RoCE的发展历程,包括RoCEv1(仅支持L2网络)和RoCEv2(支持L3路由)两种版本的技术特点。实现RoCE网络需要RoCE网卡、支持PFC的交换机以及智能无损网络架构。文章还对比了RoCEv2与InfiniBand网络的优缺点:RoCE具有成本优势和兼容性,适合大规模成熟数据

2025-12-15 23:18:52 489

转载 Meta 的DDC网络架构案例分享

Meta研发的DSF网络架构专为AI训练优化,通过物理隔离与三级解耦拓扑实现高性能。核心创新包括:双域架构分离协议处理与数据转发;信元喷射技术解决负载均衡;基于信用的硬件级无损流控;分布式故障自愈机制。DSF将万卡集群网络延迟降至微秒级,但存在专用硬件依赖、扩展性受限等局限。该架构为超大规模AI训练提供了新范式,其技术理念将影响下一代网络设计方向。

2025-12-15 00:17:48 176

转载 英伟达NVL576正交架构解析&国内正交架构超节点差异对比

英伟达最新发布的NVL576正交架构采用革命性设计,通过中置背板实现计算节点与交换节点的正交互联,相比前代NVL72显著提升了系统可靠性和可维护性。该架构单机柜推理算力达15EFLOPS,配备4.6PB/s带宽的HBM4e显存,NVLink互连带宽达1.5PB/s。与国内海光scaleX640、阿里磐久AL128相比,NVL576在互联拓扑复杂度上更为激进,保留了关键的中置背板设计。正交架构正成为下一代GPU整机柜的主流方向,其技术突破将推动AI算力规模持续扩展。

2025-12-15 00:06:16 1236

原创 AI大模型中的TP、EP、DP、PP指什么?25年智算组网的三张网分别跑什么?

摘要:AI大模型分布式训练采用四种并行策略:数据并行(DP)拆分训练数据,张量并行(TP)分解大矩阵运算,流水线并行(PP)切分模型层,专家并行(EP)分配MoE专家。实际训练常混合使用,如DP+TP+PP组合处理数据和模型维度。节点间网络承载梯度同步、计算结果传递等通信,节点内网络优化张量并行和流水线并行的设备间数据传输。集群网络则分为控制平面、数据平面、服务发现等流量类型,共同保障分布式系统的高可用性和弹性伸缩能力。(149字)

2025-12-09 02:27:42 756

原创 华为CloudMatrix384 超节点的网络架构设计

CloudMatrix384 被设计为一个 AI 超级节点,集成了 384 个昇腾 910C 算力芯片(华为称为:NPU),和 192 个鲲鹏CPU。

2025-12-04 01:49:00 1898

转载 智算数据中心的参数面组网多平面网络设计

本文重点介绍了智算中心ScaleOut组网架构及其发展趋势。主要分析了CLOS胖树架构及其变种(如Rail-only、Rail-optimized等),并详细阐述了阿里云双平面架构和DeepSeek多平面架构的创新特点。其中,多平面组网通过将GPU连接到独立网络平面,在降低成本40%的同时支持16,384个GPU扩展,且具备流量隔离优势。文章指出,未来ScaleOut组网将向二层万卡/十万卡、多端口多平面方向发展,同时对网卡提出了支持多平面通信和乱序处理的新要求,英伟达最新CX-8网卡已实现相关功能。

2025-11-25 22:41:44 698

原创 Atlas 900 A3 SuperPoD

前面板后面板Atlas 900 A3 SuperPoD 计算节点Atlas 900 A3 SuperPoD 计算节点是基于华为自研鲲鹏920高性能版处理器、昇腾910 AI处理器、交换芯片和CDR芯片的AI计算节点,满足行业智算中心、大企业和华为云等高性能、高能效液冷训练集群的需求,提供业界AI最佳集群方案,以算力、网络和集成度业界领先为目标,结合工程优势持续构筑AI集群硬件竞争力。

2025-11-14 00:23:49 407

转载 什么是网络虚拟化?一文读懂其原理与核心价值

这个定义听起来有点绕?整个过程中,Underlay网络只负责运输快递箱,根本看不到里面的原始数据,也不知道这是Overlay网络的流量,从而实现了虚拟网络与物理网络的隔离,以及虚拟网络内部的独立通信。另一方面,网络虚拟化将支撑“分布式云”场景,无论是公有云、私有云还是边缘云,都能通过统一的虚拟网络平面连通,让业务流量在不同云环境间无缝流转,真正实现“业务在哪,网络就在哪”。同时,SDN还支持网络的自动化部署,通过编写脚本或调用API,能够快速完成网络设备的配置和业务的上线,大大提高了网络部署的效率。

2025-11-14 00:19:57 129

转载 数据中心与智算网络负载均衡技术

在AI/ML的应用中,GPU或其他类型的AI/ML计算单元之间他们有着非常简单的通讯关系(流的数量非常少),并且由于他们有着极高的计算能力,导致一对通讯单元间的数据吞吐极高(单个流很大,所需的网络带宽极大),这就导致在这样的应用中存在极端的负载分担不均衡,而且这种不均衡一旦引发网络丢包,就会对整体AI/ML的任务完成时间带来显著的负面影响。RPS的优点在于简单易实施,通过细粒度的负载均衡,可以在多条并行路径之间实现较为均衡的路由选择,提升端到端的网络吞吐率,可以将并行链路利用率提高到90%以上。

2025-11-11 13:07:42 133

原创 BGP协议中什么情况下RR不反射路由?

或者,如果路由的`CLUSTER_LIST`中已经包含本RR的Cluster ID,**则不反射**,以防止环路。- RR遵循IBGP水平分割规则:从非客户端(即普通IBGP对等体)收到的路由,**不会反射给其他非客户端**。- 如果RR收到一条路由,其`ORIGINATOR_ID`(发起者ID)是它自己,**则不反射也不使用**。- 如果一条路由是从某个客户端学习到的,RR **不会将该路由再反射回该客户端**。### 1. **从非客户端(Non-Client)收到的路由,不反射给其他非客户端**

2025-08-25 15:41:28 322

原创 什么是STP

配置BPDU的长度至少要35个字节,包含了桥ID、路径开销和端口ID等参数,即{根桥ID,累计根路径开销,发送者BID,发送端口PID}。网络初始化时,网络中所有的STP设备都认为自己是“根桥”,根桥ID为自身的设备ID。存在环路的网络环境中,对于链路速率值相对较小的端口,建议将其路径开销值配置相对较大,以使其在生成树算法中被选举成为阻塞端口,阻塞其所在链路。与局域网LAN相连的有两台设备:S2和S3,如果S2负责向LAN转发配置消息,则LAN的指定桥就是S2,指定端口就是S2的BP2。

2025-08-12 23:38:33 1042

原创 RoCE网络

**科学计算**:在气象预测、基因测序、流体力学等领域,需要处理大量的数据和复杂的计算任务,RoCE网络可以提供高性能的数据传输支持。- **物联网(IoT)**:在物联网场景中,RoCE网络可以提供高性能、低延迟的数据传输,支持大规模的物联网应用。- **云服务**:在云服务提供商的数据中心中,RoCE网络可以提供高性能的网络连接,支持大规模的云服务部署。- **存储系统**:在分布式存储系统中,RoCE网络可以提供低延迟、高带宽的数据访问,提高存储系统的性能。

2025-07-07 22:19:15 1021

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除