1、free :查看内存、swap
[root@admin home]# free
total used free shared buffers cached
Mem: 1922264 222580 1699684 204 28104 61788
-/+ buffers/cache: 132688 1789576
Swap: 4194300 0 4194300
注意:查看内存还剩多少空间时,只能看-/+ buffers/cache这行的数字,上行只能参考。
Linux的特性,将打开过的文件放到cached里边,所做过关于目录结果的操作会放到buffers里边,当再次需要这些数据时,就会很快给打开,这两会不停的占用内存,但是当内存不够时,这两部分空间会被瞬间被释放。
2、uptime : 查看load,启动多少时间,目前有多少个用户
这是cpu的性能查看命令。
[root@admin ~]# uptime
10:17:52 up 1 min, 2 users, load average: 0.12, 0.08, 0.03
各项数据解析:
10:17:52 : 系统几点启动的
up 1 min : 启动多少时间,当这个时间超过180天时,系统重启时会做文件系统检测,ext3有个特性,自检特别慢。
2 users :当前有多少用户在登录
load average: 0.12, 0.08, 0.03 : 平均负载 : 1分钟平均,5分钟平均,15分钟平均
load average中这三个数很重要,主要衡量cpu工作的情况。这些数值的安全值计算方法为:cpu总核数 * 0.7,当1分钟平均值 < 安全值时,说明这机器是健康的,运算能力能承载其任务量的。如果超过了,就很危险,而且会累计的,如果一直累计不释放的话,就会导致机器死机。
实例解析:
假如机器有 10 个核心,则安全值为 :10 * 0.7 = 7
实例一:
当load average三个数分别为:5,5,5,也就是说在1分钟,5分钟,15分钟平均值都是5,也就是说机器稳定在5个任务,但是我机器是10核的cpu,总是可以满足任务量的。这三个数要衡量着来看。实例二:
当load average三个数分别为:15,10,5,1分钟,5分钟,15分钟平均值是15,10,5,这个时候说明1分钟平均值高于了15分钟的平均值,说明在1分钟内机器的要处理的任务量突然升高,可以看出这个机器时一个突发的cpu增高,此时我们应该做的不是立刻去kill掉一些进程,而是先观察1分钟的平均值,如果在下降为5,10,15,说明近期内机器的任务量下去了,或者是任务被处理掉了等,说明机器已经回到平稳阶段了。但是如果这个值在不停的增加,比如变成25,11,5,此时说明,机器确实存在问题了,在短期内有任务量剧增,这时就必须去查看是什么原因引起。
3、cat /proc/cpuinfo : 查看cpu的核数
文件/proc/cpuinfo里面存着cpu的很多基本信息,如核数。
4、vmstat :LInux/Unix监控工具
vmstat