(1)
一个[合格的]Oracle DBA在安装数据库的时候,通常都会按要求关闭NUMA(MOS:Disable NUMA At OS Level (Doc ID 2193586.1)),因为启用NUMA会导致CPU彪高,性能很差(MOS:High CPU Usage when NUMA enabled (Doc ID 953733.1))。也许是这类问题太多,从Oracle 11gR2开始,默认就关闭了NUMA特性,因为NUMA的使用比较苛刻,要结合硬件、操作系统和Oracle版本(MOS:Oracle NUMA Usage Recommendation (Doc ID 759565.1))以及应用程序。稍有不对,努力白费,所以乖乖的关掉NUMA,是比较正确的事情。
同时还搞了个隐含参数来应对想用NUMA的人(还有几个类似的NUMA隐含参数,谨慎对待):
_enable_NUMA_support=TRUE
还特意加了强调:
Recommendation:
· Customers who have tuned their Database specifically for NUMA can continue to run with NUMA enabled with Oracle Server Version 11.2.0.1.
· It is strongly recommended to customers who want to enable NUMA do sufficient testing before going into production.
这也没辙,O记实在是被NUMA搞怕了(Doc ID 759565.1):
如何检验NUMA特性被禁用了:
# numactl -H
available: 1 nodes (0)
node 0 size: 4195 MB
node 0 free: 3304 MB
node distances:
node 0
0: 10
不然可能至少有2个node。
(2)
那NUMA到底是啥玩意呢?
要搞清楚其实不太容易,要花点时间。
从硬件的角度来看,NUMA(non-uniform memory access,非一致性内存访问)是一个计算机平台,它包含多个组件/集成片,每个组件/集成片包含多个CPU、本地内存和I/O总线。为简洁起见,并从软件抽象中消除对这些物理组件/集成片的硬件视图的歧义,后续给了这些组件/集成片一个统一的名字,称为socket。
每个socket都可以看作是SMP对称多处理器的子集——独立SMP系统所需的某些组件可能不会放到socket上。NUMA系统的socket通过某种系统互连连接在一起,例如,交叉或点对点链路是NUMA系统互连的常见类型。这两种类型的互连可以聚合在一起,以创建与其他socket具有多个距离的socket的NUMA平台(这句话有点绕,在启用NUMA的OS里,你用numactl -H命令看到输出的distances部分,就大概明白这句话的意思了)。
<