2021-10-23

最新推荐文章于 2023-11-26 12:43:36 发布

猴子居士

最新推荐文章于 2023-11-26 12:43:36 发布

阅读量120

点赞数 1

分类专栏：整理--操作系统文章标签：操作系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/houzijushi/article/details/120917204

版权

整理--操作系统专栏收录该内容

1 篇文章 0 订阅

订阅专栏

浅解NUMA机制

导读
本文适合知道NUMA这个词但想进一步了解的新手。

以下的文章内容包括：NUMA的产生背景，NUMA的架构细节和几个上机演示的例子。

NUMA的诞生背景
在NUMA出现之前，CPU朝着高频率的方向发展遇到了天花板，转而向着多核心的方向发展。

在一开始，内存控制器还在北桥中，所有CPU对内存的访问都要通过北桥来完成。此时所有CPU访问内存都是“一致的”，如下图所示：

在这里插入图片描述

UMA
这样的架构称为UMA(Uniform Memory Access)，直译为“统一内存访问”，这样的架构对软件层面来说非常容易，总线模型保证所有的内存访问是一致的，即每个处理器核心共享相同的内存地址空间。但随着CPU核心数的增加，这样的架构难免遇到问题，比如对总线的带宽带来挑战、访问同一块内存的冲突问题。为了解决这些问题，有人搞出了NUMA。

NUMA构架细节
NUMA 全称 Non-Uniform Memory Access，译为“非一致性内存访问”。这种构架下，不同的内存器件和CPU核心从属不同的 Node，每个 Node 都有自己的集成内存控制器（IMC，Integrated Memory Controller）。

在 Node 内部，架构类似SMP，使用 IMC Bus 进行不同核心间的通信；不同的 Node 间通过QPI（Quick Path Interconnect）进行通信，如下图所示：

在这里插入图片描述

NUMA

NUMA

一般来说，一个内存插槽对应一个 Node。需要注意的一个特点是，QPI的延迟要高于IMC Bus，也就是说CPU访问内存有了远近（remote/local）之别，而且实验分析来看，这个差别非常明显。

在Linux中，对于NUMA有以下几个需要注意的地方：

默认情况下，内核不会将内存页面从一个 NUMA Node 迁移到另外一个 NUMA Node；
但是有现成的工具可以实现将冷页面迁移到远程（Remote）的节点：NUMA Balancing；
关于不同 NUMA Node 上内存页面迁移的规则，社区中有依然有不少争论。
对于初次了解NUMA的人来说，了解到这里就足够了，本文的细节探讨也止步于此，如果想进一步深挖，可以参考开源小站这篇文章。

上机演示
NUMA Node 分配
在这里插入图片描述

作者使用的机器中，有两个 NUMA Node，每个节点管理16GB内存。

NUMA Node 绑定

Node 和 Node 之间进行通信的代价是不等的，同样是 Remote 节点，其代价可能不一样，这个信息在 node distances 中以一个矩阵的方式展现。
在这里插入图片描述

我们可以将一个进程绑定在某个 CPU 或 NUMA Node 的内存上执行，如上图所示。

NUMA 状态
在这里插入图片描述

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
2021-10-23

浅解NUMA机制导读本文适合知道NUMA这个词但想进一步了解的新手。以下的文章内容包括：NUMA的产生背景，NUMA的架构细节和几个上机演示的例子。NUMA的诞生背景在NUMA出现之前，CPU朝着高频率的方向发展遇到了天花板，转而向着多核心的方向发展。在一开始，内存控制器还在北桥中，所有CPU对内存的访问都要通过北桥来完成。此时所有CPU访问内存都是“一致的”，如下图所示：UMA这样的架构称为UMA(Uniform Memory Access)，直译为“统一内存访问”，这样的架构对软件层面
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。