Linux 下判断Server 内存是否不足

一个客户近段时间一直让我检查他们Oracle Server 内存是否需要吃紧。
因为他一直使用linux 的Top 命令来看系统运行状况的。


下面我来写一下在linux OS 下如何判断系统是否内存吃紧。

我从两个部分来查看如何检查。

[@more@]

第一部分:查看内存使用状况

Linux 下使用Top

[root@itc-test9 ~]# top
top - 17:08:01 up 12 days,3:48,2 users,load average: 0.01, 0.01, 0.00
Tasks:95 total, 1 running,94 sleeping, 0 stopped, 0 zombie
Cpu(s):0.0% us,0.0% sy,0.0% ni, 99.5% id,0.5% wa,0.0% hi,0.0% si
Mem: 2056000k total,1963652k used, 92348k free, 59156k buffers
Swap:4096564k total, 164k used,4096400k free,1605276k cached

PID USER PRNIVIRTRESSHR S %CPU %MEM TIME+COMMAND
1 root 16 04744552460 S0.00.0 0:00.46 init

从Top 显示来看是有1963652K已经使用,只有92348k 内存空闲。一直问我是否内存不足了。下面就来解释一下Oracle 在Linux 下如何查看OS 内存是否不足。


但我们从Linux command free 来看:

[oracle@itc-test9 ~]free
total used free shared buffers cached
Mem: 2056000 1869596 186404 0 59172 1512236
-/+ buffers/cache: 298188 1757812
Swap: 4096564 164 4096400


-/+ buffers/cache: used=298188k =291.2M
free=1757812k=1716.6M 约等于2G。

从Free 命令行来看OS 还有1.76G 空间未使用。

需要解释一下Free 和Top 在Linux 下的不同显示问题。

Free命令显示在操作系统中使用和空闲的内存数量。
Top 显示是和Linux 对内存使用的方式关系紧密,linux 尽可能的要求
使用物理内存来提高Buffer 和Cache 对Disk 的I/O操作。Linux 将尽可能多的将I/O 操作磁盘上的信息保存在内存当中,如果Oracle(其他程序也一样)需要更多的内存空间,Linux 才会将一些内存使用LRU 算法清理出来,如果不需要则继续保持这些数据信息在内存中。所以我们使用Top看到的Memory Free Mem: 2056000k total,1963652k used, 92348k free 很少。

free 命令显示的Mem free 数量是系统直接可以使用的内存,没有包括LRU 交换Pages

第二部分:查看Swap 的状况:

Swap 空间的使用状况也能分辨出Oracle 服务器内存是否已经吃紧。

先看Swap 大小设定:
RAM Size Swap Size
1-2G 1.5 倍 RAM
2-8G 1 倍 RAM
>8G 0.75 RAM

基本上每个操做系统(除Windows)都建议Swap 使用上面比例的配置。
但根据个人经验如果Server 的Memory >32G 时,一般都会将Swap 空间设置在10g 以内,甚至更小。

使用Command more /proc/meminfo 或top 来Monitor Swap 的使用状况。

[root@itc-test9 ~]# more /proc/meminfo
MemTotal: 2056000 kB
MemFree: 177268 kB
Buffers: 59292 kB
Cached: 1519188 kB
SwapCached: 4 kB
Active: 1092248 kB
Inactive: 654096 kB
HighTotal: 0 kB
HighFree: 0 kB
LowTotal: 2056000 kB
LowFree: 177268 kB
SwapTotal: 4096564 kB
SwapFree: 4096400 kB

[root@itc-test9 ~]# top
top - 17:08:01 up 12 days,3:48,2 users,load average: 0.01, 0.01, 0.00
Tasks:95 total, 1 running,94 sleeping, 0 stopped, 0 zombie
Cpu(s):0.0% us,0.0% sy,0.0% ni, 99.5% id,0.5% wa,0.0% hi,0.0% si
Mem: 2056000k total,1963652k used, 92348k free, 59156k buffers
Swap:4096564k total, 164k used,4096400k free,1605276k cached

如果你观察Swap 中的使用量一直在增加,或Swap used 为一个很大的值。那我们基本就能确定在现有的状况下Oracle server 内存出现问题。(我们需要考虑此现象是偶尔发生还是一直出现)
我们需要做:
增加内存
减少OS 程序使用内存资源,如Oracle 减少SGA_target 或Memory_Target(11g)
增大交换空间

你可以通过vmstat 来看当前Swap 活动的状态。
Swap 下面的Si 和So 分别显示Swap 页面交换进来和交换出去。

[root@itc-test9 ~]# vmstat 3 8
procs -----------memory---------- ---swap-- -----io---- --system-- ----cpu----
rb swpd free buffcache si so bi bo in cs us sy id wa
00 164 17546859292 1520344 0 0 1 21 4 2000 990
00 164 17553259292 1520344 0 0 0 48 1038 4100 1000
00 164 17553259292 1520344 0 0 0 61 1032 3500 990
00 164 17553259292 1520344 0 0 0 11 1028 3900 1000
00 164 17553259292 1520344 0 0 0 15 1024 3900 1000

使用Vmstat 命令只能看当前的Swap 页面的交换入和交换出。那如何看历史Swap 信息呢。

Linux 下有一个命令可以看,那就是


[root@itc-test9 sa]# cd /var/log/sa
[root@itc-test9 sa]# ls -al |grep 13
drwxr-xr-x 2 root root 4096 Apr 13 00:00 .
-rw-r--r-- 1 root root 209328 Apr 13 17:50 sa13

[root@itc-test9 sa]# date ----今天是4/13 号
Mon Apr 13 17:58:02 CST 2009

[root@itc-test9 sa]# ll |grep 13
-rw-r--r--1 root root 209328 Apr 13 17:50 sa13

[root@itc-test9 sa]# sar -W -f sa13
Linux 2.6.9-5.ELsmp (itc-test9) 04/13/2009

12:00:01 AMpswpin/s pswpout/s
12:10:01 AM 0.00 0.00
12:20:01 AM 0.00 0.00
12:30:01 AM 0.00 0.00
12:40:01 AM 0.00 0.00
12:50:01 AM 0.00 0.00
01:00:01 AM 0.00 0.00
01:10:01 AM 0.00 0.00
01:20:01 AM 0.00 0.00
......(中间略去)
...... (中间略去)
03:50:01 PM 0.00 0.00
04:00:01 PM 0.00 0.00
04:10:01 PM 0.00 0.00
04:20:01 PM 0.00 0.00
04:30:01 PM 0.00 0.00
04:40:01 PM 0.00 0.00
04:50:01 PM 0.00 0.00
05:00:01 PM 0.00 0.00
05:10:01 PM 0.00 0.00
05:20:01 PM 0.00 0.00
05:30:01 PM 0.00 0.00
05:40:01 PM 0.00 0.00
05:50:01 PM 0.00 0.00
Average: 0.00 0.00

显示从今天0点到当前的所有Swap 页面交换的数量


第三、free输出的解释

[root@Linux /tmp]# free
total used free shared buffers cached
Mem: 4149156 4130412 18744 0 13220 2720160
-/+ buffers/cache: 1397032 2752124
Swap: 6289408 144 6289264第1行
total 内存总数: 4149156
used 已经使用的内存数: 4130412
free 空闲的内存数: 18744
shared 当前已经废弃不用,总是0
buffers Buffer Cache内存数: 13220
cached Page Cache内存数: 2720160

关系:total = used + free

第2行:
-/+ buffers/cache的意思相当于:
-buffers/cache 的内存数:1397032 (等于第1行的 used - buffers - cached)
+buffers/cache 的内存数: 2752124 (等于第1行的 free + buffers + cached)

可见-buffers/cache反映的是被程序实实在在吃掉的内存,而+buffers/cache反映的是可以挪用的内存总数。

第三行单独针对交换分区, 就不用再说了.

为了提高磁盘存取效率, Linux做了一些精心的设计, 除了对dentry进行缓存(用于VFS,加速文件路径名到inode的转换), 还采取了两种主要Cache方式:Buffer Cache和Page Cache。前者针对磁盘块的读写,后者针对文件inode的读写。这些Cache有效缩短了 I/O系统调用(比如read,write,getdents)的时间。

如果感兴趣可以进一步参考文件/proc/meminfo,free命令就是根据它的信息生成的。free命令的源码可从procps-xxx-.src.rpm获取,xxx为版本号,比如procps-3.2.3-5.3.src.rpm。

参考内核代码:

arch/i386/mm/init.c
fs/proc/proc_misc.c
include/linux/swap.h
mm/filemap.c
fs/buffer.c

另外还可以参考O'REILLY的书《Understanding the LINUX KERNEL》。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/670493/viewspace-1024920/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/670493/viewspace-1024920/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值