范桂飓-CSDN博客

原创 AWS 云技术专栏系列文章

目录文章目录目录AWSAWS《2021 亚马逊云科技中国峰会，对话 “容器混合云会是未来的答案吗？”》《无处不在的 AWS 云计算》《全面解读 AWS Private 5G 的革新理念》《AWS — 重塑混合云》《AWS — VPN 虚拟专用云》《AWS — AWS Local Zone》《AWS — AWS Wavelength》《AWS — AWS Outposts》《AWS — AWS Direct Connect》《AWS — AWS EC2》《AWS — AWS ECS》

2022-04-05 17:34:25 4870 2

原创软硬件融合加速技术系列文章

目录文章目录目录计算机组成原理Linux 操作系统原理处理器进程管理内存管理I/O 系统文件系统网络协议栈资源管理设备管理GPUFPGASmartNIC/DPU计算机组成原理《计算机组成原理 — 冯诺依曼体系结构》《计算机组成原理 — 基本硬件设备》《计算机组成原理 — CPU 中央处理器》《计算机组成原理 — 指令系统》《计算机组成原理 — 总线系统》《计算机组成原理 — 存储系统》《计算机组成原理 — 输入输出系统 — 存储控制器接口类型》《计算机组成原理 — 服务器》《计算机组成

2022-04-02 19:09:18 5353

原创架构师之路系列文章

目录文章目录目录软件架构API 经济系统架构分布式系统分布式消息队列分布式任务队列高可靠要求高性能要求安全要求软件架构API 经济《架构师之路 — API 经济 — API 实现方式》《架构师之路 — API 经济 — RESTful API 设计规范》《架构师之路 — API 经济 — Web、HTTP Server、API Service、Application》《架构师之路 — API 经济 — Swagger & OpenAPI Specification》系统架构分布式系

2022-02-05 15:26:52 3753 4

原创云计算与云原生技术系列文章

目录文章目录目录OpenStack IaaSKubernetes CaaSOpenShift PaaS云计算行业剖析云计算发展预测OpenStack IaaSKubernetes CaaSOpenShift PaaS云计算行业剖析云计算发展预测

2021-08-04 15:14:30 4965 6

原创云网融合与算力网络系列文章

目录文章目录目录OvSDPDKVPPNeutronOvS《OpenFlow Switch 1.3 规范》《OpenvSwitch 架构解析与功能实践》《基于 Open vSwitch 的 OpenFlow 实践》DPDK《用户态网络协议栈还是内核协议栈？》《DPDK — 数据平面开发技术》《DPDK — 数据平台优化技术》《DPDK — 架构解析》《DPDK — 安装部署》《DPDK — PMD，DPDK 的核心优化》《DPDK — IGB_UIO，与 UIO Framework

2021-02-28 13:43:12 7680 7

原创 5G + 边缘计算系列文章

目录文章目录目录5GUENRNGCUE + NR + NGC边缘计算ETSI云边缘云网融合云边协同分布式云算力网络边缘原生OpenNESSKubeEdgeOpenYurtOthers5G《5G — 3 大场景、8 大 KPI》《5G 3GPP 标准》《5GC 关键技术 5G 专网》《5GC 关键技术之网络切片》《5GC 关键技术之本地分流》《5G 网络关键流程解读》UE《5G 需要换 SIM 卡吗？》NRNGC《5G NGC 系统架构》《5G 核心网的 UPF（User Plan

2020-12-26 01:21:27 12375 12

原创 GPU 超级节点：AWS Trainium2 UltraServer

Trainium1 于 2020 年发布，使用 NeuronCore-v2 核心，是一款用于专注于 AI/ML 训练的加速芯片，支持 BF16 和 FP32 进行高精度训练，以及支持 TF32、FP16 和 INT8 以提高效率，还配备了专用的集合通信库芯片。可用于训练数十亿参数的大模型。2024 年，AWS 宣布了下一代 Trainium3 芯片，采用 3nm（纳米）制程，预计将比 Trainium2 提升 2 倍的性能，改善 40% 的能效，将于 2025 年底推出。所以，是的，这大约好 37.5%。

2025-05-19 00:34:02 1533

原创英语口语错题集

解释：“Calling” is a verb or gerund, not a countable noun in this case. “Calls” is the correct plural noun for phone calls.解释：The subject “a person” already applies to both actions, so you don’t need to repeat “they need to”.解释：“Who talking” → “who talk”

2025-05-10 17:45:37 899

原创人工智能发展史 — 物理学诺奖之 Hopfield 联想和记忆神经网络模型

约翰·霍普菲尔德（John Hopfield）文学士、物理学博士，研究领域横跨物理学、分子生物学、神经科学、计算机科学，是一名以推动跨学科交叉融合而闻名于世的科学家，其推动了物理学与生命科学、人工智能的交叉融合，被誉为 “扩展统计物理学边界的先驱”，获得了 2024 年的物理学诺贝尔奖。霍普菲尔德早期是理论物理学家，专注于固体物理和量子力学，研究电子行为与能量状态，在激化子、长程电子输运等方面有极大的贡献。

2025-05-03 11:49:52 1336

原创人工智能发展史 — MP 模型和感知机模型的数学模型与编程应用

这意味着用于描述样本的特征需要由专家设计，算法性能依赖于人工设计和抽取这些特征的准确度，以便使模型能够完成特定的任务，因此它的应用受到了很大的限制。其中，“阈值逻辑”、“Hebb 学习率”，前 2 个理论解决了单个神经元层面的建模问题，来自于对大脑神经元的生理学研究，共同构成了 “感知机” 的理论基础，在 1950s 提出；所以，和 MP 模型一样，感知机模型也是一个应用于线性分类场景的 “二分类” 分类器，训练的目标是找到一个超平面（例如：在二维空间中的超平面是一条直线），来将特征空间中的样本分为两类。

2025-04-26 02:43:41 392

原创案例分析：东华新径，拉动式生产的智造之路

客户对质量的吐槽：转向系统涉及汽车安全性关键，客户对产品质量要求极高，对故障率的态度是零容忍。产线对产量的吐槽：市场对产品的需求多变，生产线时而闲死，时而忙死，生产排班计划经常变化。生产计划是按月排的。后勤对仓库的吐槽：仓库需要提前一天备好物料，生产计划的频繁修改，让仓库备货手忙脚乱。仓库物料时按天备的。王总的吐槽：车间管理漏洞百出，东西乱摆乱放，小作坊现象严重。核心述求：如何确保产量的同时保证产品质量？产品质量问题根因追溯难、解决慢、成本高！生产计划跟不上市场订单的变化！

2025-04-11 23:58:19 924

原创 AI 数理逻辑基础之统计学基本原理（上）

离散系数是一种 “无量纲” 的相对度量，公式如下，离散系数等于标准差除以均值，从而消除了量纲的影响，例如：1.4/6=0.23 和 14/60=0.23 之间的 CV 相同，但量纲相差了 10 倍。Pearson 用于测量 x 和 y 连续变量之间的线性相关性，但现实中存在大量非线性相关的数据集，但它们之间也会存在某种关联关系，如单调关系。掌握统计学的数据科学家或工程师，他们和具体的行业紧密相联，有扎实的统计基础，也有丰富的行业经验。通过海量数据进行分析，获得具有巨大价值的产品和服务，或深刻的洞见。

2025-04-04 23:58:42 1149 1

原创联结主义人工智能发展史

核心思想是：认为人的智能归结为人脑的高层活动的结果，强调智能活动是由大量简单的单元通过复杂链接后并行运行的结果。弗兰克·罗森布拉特（Frank Rosenblatt）基于 MP 模型再进一步发明并在 IBM-704 计算机上实现了一种新的神经元数学模型，称为感知机模型（Perceptron），现在也将其称为一种单层神经网络，是神经网络和支持向量机的基础，作为早期神经网络研究的一个重要里程碑。即：感知机是二分类的线性模型，其输入的是实例的特征向量，输出的是实例的类别（+1 和 -1）。

2025-04-02 16:29:56 585

原创 AI 算力的科学衡量与计算方式

在这些应用中，对于一些实时性要求较高的任务，如图形渲染、音视频处理等，单精度浮点数能够提供足够的精度，并且在存储和计算上更加高效，能够满足实时性和资源限制的需求。我们知道，计算机是以 0 和 1 构成的二进制数字进行运算的，比如在基础的二进制里，1 就是 1，2 就变成了 “10”，3 是 “11”。算力（Computational Power）：指计算机系统的运算能力，涵盖了 CPU、GPU、TPU、NPU 等运算芯片的能力特征，算力决定了计算机处理信息的速度和效率，是评估计算机整体性能的重要指标。

2025-03-26 20:47:10 977

原创 GPU/CUDA 发展编年史：从 3D 渲染到 AI 大模型时代（上）

要彻底搞明白 GPU 和 CUDA 的运行原理并不容易，而回顾技术的发展历史则是知其然且知其所以然的一个好方法，所以本文会使用篇年纪的方式进行写作。

2025-03-03 00:32:31 4477 3

原创 NCCL AI 分布式训练集合通讯库技术基本原理

NCCL（NVIDIA Collective Communication Library）集合通讯库，是 NVIDIA 为 AI 模型开发者提供的、专用于控制多张 GPU 之间进行高效通信的 lib 库，应用于分布式 GPU 训练场景。如下深度学习软件堆栈图所示。NCCL 的北向是 AI 模型开发框架 PyTorch、Paddle、TensorFlow 等，这些 AI 框架通过集成、调用 NCCL lib 库来控制 GPU 之间的数据通信方式。

2025-02-28 12:59:57 1463

原创大规模 RDMA AI 组网技术创新：算法和可编程硬件的深度融合

对于上述问题，HPCC 的核心思想是利用 INT（In-Network Telemetry，在网遥测）技术来提供精确的链路负载信息，并以此来计算出准确的 Sender 速率更新数值，并且实践发现 HPCC 在大多数情况下仅需要 Sender 更新一次速率，而无需迭代更新。TIMELY 算法的核心思想是通过测量报文的 RTT（端到端往返时间）来动态调整 Sender 的发送速率，基于 RTT 的变化进行梯度计算，进而根据梯度实现了基于速率（rate-based）的调速方法。

2025-02-22 19:10:14 1535

原创 RoCEv2 高性能传输协议与 Lossless 无损网络

它是 DCB (Data Center Bridging）标准的一部分，用于将流量分配到不同的队列，为每个队列分配一个权重，控制每个流量队列能够使用的带宽百分比，保证高优先级的流量，如 RDMA 流量通常会分配足够的带宽资源。因此，一旦出现丢包，就只能采用 go back N 重传机制，比如：网络链路上已经发送了 1，2，3，4，5 个数据包，假如当 2 这包丢掉了，那么 3，4，5 这三个包都要重传，重传的成本非常大。如下图所示，一旦发生丢包重传，RDMA 的性能就会急剧下降。

2025-02-22 10:45:05 1873

原创 RDMA 高性能通信技术原理

DMA 技术出现后，NIC 增加了 DMA Controller（DMA Engine）功能模块，首先将 NIC Rx/Tx Queue 与 Main Memory 中的 ZONE_DMA 建立映射关系，然后当 Frames 进入 NIC Rx/Tx Queue 时，DMA Controller 就会将这些 Frames 通过 DMA Copy 的方式存放到 ZONE_DMA 中，期间完全不需要 CPU 的参与。但相对的，由于连接机制和可靠性保障机制的存在，导致 RC 的通信开销较大。

2025-02-17 19:13:40 1297

原创 AI 技术原理与应用场景系列文章

RDMA 高性能通信技术原理》

2025-02-17 16:21:27 475

原创 8 卡 GPU 服务器与 NVLink/NVSwitch 互联技术

NVLink 是一种点对点的高速互连技术，单条 NVLink 就是一条全双工双路信道，每条 NVLink 链路可以将 2 个 GPU 直连起来，并且每个 GPU 可以提供多条 NVLink 接口连接多个 GPU。另外，PCIe Switch 互联拓扑中的 GPU 之间可能存在 GPU0→Switch0→CPU0→CPU1→Switch1→GPU7 的通信链路，它的通信不可避免的存在一定的延迟，因而更适合用于对信号效率不敏感且追求性价比的使用场景，如：推理、云计算等领域。本文讨论的是单机 GPU 卡间互联。

2025-02-06 22:02:48 1867

原创人工智能发展历程

AI

2025-01-28 10:13:42 1250 1

原创系统学英语 — 句法 — 复合句

其中常见的抽象名词有：news、idea、promise、question、doubt、thought、hope、message、suggestion、possibility、order、truth、proposal、belief 等。：使用代词 It 将冗长的主语代替并前置，真正的主语被后置。定语从句的 3 要素包括：先行词 + 定从引导词 + 从句结束位置。充当宾语的句子，通常位于谓语之后，也可以位于介词之后（介宾）和形容词之后（形宾）。充当主语的句子，通常位于谓语之前，不常见的也有主语后置的情况。

2025-01-27 19:20:00 918

原创共享图书产品需求分析

大数据分析软件：根据图书被借阅数据、人员借书数据分析读者的读书偏好以及书籍的热度，可对在校学生的阅读进行评估。其他行业：汽车合格证管理、高端鞋包租赁展示管理、企业保密档案管理、企业重要合同协议文件管理等。图书行业：图书馆智能书柜、中小学分布式图书馆、微型图书馆、共享图书、漂流书柜、图书无人零售；智能图书柜的应用场景是非常广泛的：学校、图书馆、社区、写字楼、大型企业、地铁等地方。医疗行业：药品无人零售、重点器材药品管理、医院重点档案检测报告管理等；15. (手机或卡片自动记录还书信息)17. 点击“换书”

2024-12-25 09:18:17 1066

原创 AWS re:Invent 2024 — AI 基础设施架构

最后，Peter 在 2024 re:Invent 第一天的 Keynote 中总结：“通过持续在诸如 Nitro、Graviton 和 Tranium2 等领域的核心创新投资，亚马逊云科技正在构建更强大的人工智能服务器。而持续的领先，来自于对硬件细节极致的追求。

2024-12-16 16:44:37 21539

原创人工智能神经网络基本原理

MP 神经元数学模型是一个包含输入，输出与计算功能的模型。输入：权重：每个输入都就有一个权重。一个神经网络的训练算法就是让权重的值调整到最佳，以使得整个网络的预测效果最好。计算：下图展示了 2 个计算功能。输出：下图可见，z 是在 a 和 w 的线性加权和叠加了一个函数 g 的值。在 MP 模型里，函数 g 是 sgn 函数（取符号函数）。下面对神经元模型的图进行一些扩展。将 sum 函数与 sgn 函数合并到一个圆圈里，代表神经元的内部计算，即：MP 模型中的刺激函数 f。

2024-11-17 13:59:02 1623 2

原创系统学英语 — 句子成分

句子成分的类型包括：主、谓、宾、表、定、状、补、同位语。

2024-11-06 09:13:06 739

原创数据要素资料阅读笔记

数据空间是一种保障数据共享、流通和应用的分布式可信数据流通基础设施，互联网龙头企业基于自身技术基础积极探索数据空间方案，例如华为云交换数据空间 EDS、腾讯云数链通数据共享平台、百度以区块链为核心的数据安全流通解决方案等，此外，中国移动的数联网服务平台 DSSN、中国电信的数据要素融通服务平台 “灵泽”等均为企业搭建数据共享流通技术空间的有益实践。数据要素的持有者，在收益未达预期时，不愿与更多人分享和复用，会采用多种手段保护数据不被泄露，并限制其他人访问数据，这些限制导致数据要素变得稀缺。

2024-10-11 00:21:13 471

原创论文阅读笔记 —— 数字化转型对 Y 公司运营效率影响研究

Y 公司的发展也得到了市场的肯定与关注，根据 Y 公司官网的相关统计数据显示，仅 2023 年， Y 公司的整车销量就达到了 336.7 万辆，同比增长幅度为 5.1%;其营业收入达到了 6249.4 亿元，同比增长率达到了 6%。与此同时，Y 公司在技术领域、产品领域以及战略布局等多个领域都处于行业领先的地位。

2024-10-07 00:38:41 518

原创数智化转型资料阅读笔记

数字的定义：与其他信息资源相比具有可复制、可传输、可计算的特点。数字化的定义：包括数据的采集、传输、存储、计算和应用，是指将各类复杂多变的信息转变为可以度量的数据，并加以处理的过程。数字化转型的定义：指企业利用新一代数字技术，将某个生产经营环节乃至整个业务流程的物理信息链接起来，形成有价值的数字资产，通过计算反馈有效信息，最终赋能到企业商业价值的过程。当今企业运用数字化相关技术和工具，推动企业转型，从而将数字价值叠加到企业的商业价值，增强自身竞争力。

2024-10-06 00:40:52 506

原创网络协议 — Keepalived 高可用方案

Keepalived 最初是为 LVS（Linux Virtual Server）L4 负载均衡方案而设计的 RS（真实服务器）集群健康状态检测软件，通过 TCP 和 IP 协议来实时（毫秒级）检测负载均衡后端集群中的每个 RS 节点的健康状态，并根据状态实现实时的 RS 节点移除和添加。以此来保证 RS 集群始终是 Keep Alive 的。优先级不会不断的提高或者降低，不管提高优先级还是降低优先级，最终优先级的范围是在 [1,254]，不会出现优先级小于等于 0 或者优先级大于等于 255 的情况。

2024-07-10 19:49:39 715

原创 Intel HDSLB 高性能四层负载均衡器 — 代码剖析和高级特性

在前 2 篇文章中，我们从快速入门、应用场景、基本原理、部署配置这 4 个方面，整体地介绍了 Intel HDSLB 作为新一代高性能四层负载均衡器的研发背景、解决方案以及性能优势，并通过 step by step 的方式，希望帮助更多的读者能够便捷地在自己的开发机运行和使用起来。在本篇中，我们将继续向前，对 HDSLB-DPVS 开源版本的代码进行剖析，并介绍其中一些有趣的高级特性。Intel HDSLB 高性能四层负载均衡器 — 快速入门和应用场景。

2024-06-16 15:59:55 1546 1

原创 Intel HDSLB 高性能四层负载均衡器 — 基本原理和部署配置

在上一篇《Intel HDSLB 高性能四层负载均衡器 — 快速入门和应用场景》中，我们着重介绍了 HDSLB（High Density Scalable Load Balancer，高密度可扩展的负载均衡器）作为新一代高性能四层负载均衡器的需求定位、分析了 HDSLB 在云计算和边缘计算应用场景中的特性优势，以及解读了 HDSLB 的性能测试数据。再进一步的，在本篇中我们主要关注 HDSLB 的基本运行原理和部署配置方式，更侧重于实际的操作。

2024-05-26 21:43:56 1927

原创 Intel HDSLB 高性能四层负载均衡器 — 快速入门和应用场景

开源的新一代高性能负载均衡器。

2024-05-14 22:49:05 2261 9

原创 2022 亚马逊云科技中国峰会，对话开发者论坛

我认为可以把开发者社区看成一个 “产品” 来对待，一个好的产品首先是有一个清晰的 “产品定位” 和 “用户画像”，这是前提。然后再以能够满足客户需求、以解决客户痛点、帮助客户增长为优先的。所以，开发者社区这个 “产品” 更像是一个 “平台型的产品”，要有人人为我、我为人人的服务精神，以帮助平台上的用户成功为己任。我们常说：“云计算时代，得开发者得天下”，所以一个开发者社区只要能够服务好开发者群体，那么无论对用户来说，还是对自身来说就都是成功的。

2024-05-03 12:47:29 1329

原创系统学英语系列文章

》《》《》《》《》《》

2024-01-21 23:28:19 923

原创系统学英语 — 句法 — 简单句

使用代词 It 将冗长的主语代替并前置，真正的主语被后置。充当宾语的句子，通常位于谓语之后，也可以位于介词之后（介宾）和形容词之后（形宾）。谓语句型，即：围绕着谓语展开的句子型式，包括时态、情态、语态这 3 大类型。充当主语的句子，通常位于谓语之前，不常见的也有主语后置的情况。充当表语的句子，通常位于系动词之后。

2024-01-21 18:22:49 1398

原创系统学英语 — 介词 — 千变万化

词源：before 中的 -fore 前面，面向，朝向。衍生出目的的含义，为了。例如：A of B，B 有 A，B 的 A，反之亦然，所属关系时相互的。about 不仅仅在外面，还在外面绕圈的所有东西，即：于某个东西周围相关的所有的东西，关于。词源：in（里面） + to（朝向），即：进到里面去，例如：水进入到瓶子里面去。词源：符号 @，对着 / 朝着 / 向着 / 瞄准着一个点，后衍生出精准的点。词源：把东西从盒子拿出来（出去），衍生为盒子空了（没了）。词源：不接触，衍生出散去（离开不接触，各散东西）。

2024-01-13 22:30:53 2510

原创系统学英语 — 词根词缀 — 举一就反三

动词词根词源固定搭配。

2024-01-07 21:50:35 2976

原创系统学英语 — 音标音节 — 能读就能写

一个音节可由一个元音、或一个元音和若干个辅音组成。

2024-01-07 00:57:37 1533

5G 核心网关键技术和对业务的支撑.pdf

中国联通智能MEC技术白皮书.pdf

H3C_CAS安装指导V1.0.docx

中间人网络设备如何完成 TLS extensions 合法插入？

女孩子做项目管理是什么体验？！：）