linux oracle 强制覆盖_Oracle 之Hugepage

3315718804e9af0678a67a1cda741e26.png

1. Hugepage基本概念

系统进程是通过虚拟地址访问内存,但是CPU必须把它转换成物理内存地址才能真正访问内存。

为了提高这个转换效率,CPU会缓存最近的"虚拟内存地址和物理内存地址"的映射关系,并保存在一个由CPU维护的映射表(page table)中。


page table(页表)是操作系统上的虚拟内存系统的数据结构模型,用于存储虚拟地址与物理地址的对应关系。当我们访问内存时,首先访问"page table",然后Linux再通过"page table"的mapping来访问真实物理内存(RAM或SWAP).


在32位系统下,一个进程访问1GB的内存,会产生1M的页表,如果是在64位系统,将会增大到2M。

很容易推算,如果一个SGA设置为60G,有1500个ORACLE用户进程,64位LINUX的系统上,最大的页表占用内存为:60*2*1500/1024=175G 。


为了尽量提高内存的访问速度,需要在映射表中保存尽量多的映射关系。而在Redhat Linux中,内存都是以页(Page)的形式划分的,默认情况下每页是4K Bytes,这就意味着如果物理内存很大,比如64G ,则映射表的条目将会非常多,这将会影响CPU的检索效率(CPU需要转化虚拟地址为物理地址)。而且根据上面的推算,页表会占用比物理内存还多的内存大小。


因内存大小是固定的,为了减少映射表的条目,可采取的办法只有增加页的尺寸。这种增大的内存页尺寸在Linux 2.1中,称为Big page;在AS 3/4或后续版本中,称为Hugepage。如果系统有大量的物理内存(大于8G),则无论32位的操作系统还是64位的,都应该使用Hugepage。


2. Hugepage基本信息查看

Linux中,可以通过如下命令来查看HugePage相关的值:

$ cat /proc/meminfo | grep Huge

HugePages_Total: 0

HugePages_Free: 0

HugePages_Rsvd: 0

Hugepagesize: 2048 KB


通常情况下,Linux hugepage大小为2MB (不同的处理器架构,可能不一样)

HugePages_Total: Hugepage的页面数量

HugePages_Free: 剩余的页面数量

HugePages_Rsvd: 被分配预留但是还没有使用的page数目

Hugepagesize: 每单位数量大小


注意: 使用Hugepage内存是共享内存,它会一直pin在内存中,不会被交换出去,也就是说使用hugepage的内存不能被其他的进程使用,所以一定要合理设置这个值,避免造成浪费。对于只使用Oracle的服务器来说,把Hugepage_pool设置成稍大于SGA大小即可。PGA因不是共享内存,是使用不到Hugepage的。


HugePages_Free - HugePages_Rsvd部分的内存是浪费的,且不能被其他程序使用。在实际应用中,

尽可能让HugePages_Free - HugePages_Rsvd=0

设置了多少的huge page,free内存就会被使用多少。比如:设置sysctl vm.nr_hugepages=1024

之后, free命令可以看到free的内存会减少2048MB (1024*2M)。(这也和Hugepagesize的大小有关)


3. Hugepage的好处:

a. 大大提高了CPU cache中存放的page table所覆盖的内存大小,从而提高了TLB命中率。

b. CPU cache中有一部分TLB(Translation Lookaside Buffer)用来存放部分page table以提高虚拟内存地址到物理内存地址转换的速度。因为page size变大了,所以同样大小的TLB,所覆盖的内存大小也变大了。

提高了TBL命中率,也就是提高了地址转换的速度。

c. 减少CPU的sys的使用。由于提高了CPU的TLB的命中率,也就降低了CPU的sys部分的使用。

d. 大页会将SGA LOCK在RAM里, 当内存短缺的时候也不会被page out


4. 如何配置Hugepages

根据下面的步骤来配置Hugepages,修改Hugepages需要重启机器。

1). 需要在/etc/security/limits.conf 中设置memlock值(单位KB),该值小于内存大小,

例如你的内存大小是64G,有可以设置以下的值:

* soft memlock 60397977

* hard memlock 60397977

这个值大于SGA需求并没有什么害处。


2). 重新登录root和oracle用户,检查memlock limit

$ ulimit -l

60397977


3). 如果你使用11G及以后的版本,AMM(自动内存管理)已经默认开启,但是AMM与Hugepages

是不兼容的(因为hugepage是共享内存,不适合PGA),必须先关闭AMM。


4). 确保你的全部实例都已经启动(包括ASM) ,然后根据Document 401749.1 的hugepages_settings.sh

去评估需要设置的Hugepages的大小。

$ ./hugepages_settings.sh

...

Recommended setting: vm.nr_hugepages = 1496

注:也可以自己计算需要的Hugepages大小,其实就是Hugepages size> all of the SGA size


5). 编辑/etc/sysctl.conf 设置 vm.nr_hugepages参数:

vm.nr_hugepages = 1496

6). 停止实例并重启OS系统

7). 检查设置是否生效

系统重启后,启动全部的数据库,通过以下命令检查

# grep HugePages /proc/meminfo

HugePages_Total: 1496

HugePages_Free: 485

HugePages_Rsvd: 446

HugePages_Surp: 0

HugePages_Free< HugePages_Total 既说明Hugepages已经生效,同时HugePages_Rsvd不为"0".


5. 如何控制数据库SGA是否使用Hugepages?

11.2.0.2之前的版本,DB的SGA只能选择全部使用hugepages或者完全不使用hugepages。

11.2.0.2 及以后的版本, oracle增加了一个新的参数"USE_LARGE_PAGES"来管理数据库如何使用 hugepages.

在11.2.0.3的时候,USE_LARGE_PAGES这个参数让Oracle的行为更加灵活。如果出现HugePage分配不足的情况,

SGA是可以使用那些small pages的。这就保证了极端情况下数据库是可以正常运行的。

USE_LARGE_PAGES参数有三个值: "true" (default), "only", "false" and "auto"(since 11.2.0.3 patchset).


a). 现在默认值是"true",如果系统设置Hugepages的话,SGA会优先使用hugepages,有多少用多少。

11.2.0.2 如果没有足够的 hugepages, SGA是不会使用hugepages的. 这会导致ORA-4030错误,因为hugepages已经从物理内存分配,但是SGA没有使用它,却使用其他部分内存,导致内存资源不足。 但是在11.2.0.3版本,这个使用策略被改变了,SGA可以一部分使用hugepages,剩余部分使用small pages。这样,SGA会有限使用hugepages,在hugepages用完之后,再使用regular sized pages。


b). 如果设置为"false" , SGA就不会使用hugepages

c). 如果设置为 "only" 如果hugepages大小不够的话,数据库实例是无法启动的 (防止内存溢出的情况发生).

d). 11.2.0.3版本之后,可以设置为 "auto".这个选项会触发oradism进程重新配置linux内核,以增加hugepages的数量。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值