运维最新关于linux系统调优这一篇文章就够了,【金三银四

最后的话

最近很多小伙伴找我要Linux学习资料,于是我翻箱倒柜,整理了一些优质资源,涵盖视频、电子书、PPT等共享给大家!

资料预览

给大家整理的视频资料:

给大家整理的电子书资料:

如果本文对你有帮助,欢迎点赞、收藏、转发给朋友,让我有持续创作的动力!

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

答案:服务器2

如果服务器的CPU为1核心,则load average中的数字 >=3 负载过高,如果服务器的CPU为4核心,则load

average中的数字 >=12 负载过高。

经验:单核心,1分钟的系统平均负载不要超过3,就可以,这是个经验值

4.2 CPU性能评估

  • 1.vmstat 命令(监控系统CPU)

[root@localhost ~]# vmstat

procs -----------memory---------- —swap-- -----io---- -system-- ------cpu-----

r b swpd free buff cache si so bi bo in cs us sy id wa st

1 0 0 3059368 2104 230268 0 0 0 0 28 26 0 0 100 0 0

r列表示运行和等待cpu时间片的进程数,这个值如果长期大于系统CPU的个数,说明CPU不足,需要增加CPU。

b列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等。

us列显示了用户进程消耗的CPU 时间百分比。us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,就需要考虑优化程序或算法。

sy列显示了内核进程消耗的CPU时间百分比。Sy的值较高时,说明内核消耗的CPU资源很多。

根据经验,us+sy的参考值为80%,如果us+sy大于 80%说明可能存在CPU资源不足。

  • 2.top命令(实时监控系统CPU)

[root@localhost ~]# top

top - 04:50:43 up 2 days, 13:41, 1 user, load average: 0.10, 0.06, 0.06

Tasks: 102 total, 1 running, 101 sleeping, 0 stopped, 0 zombie

%Cpu(s): 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st

KiB Mem : 3865308 total, 2912528 free, 573852 used, 378928 buff/cache

KiB Swap: 524284 total, 524284 free, 0 used. 3028580 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

38151 root 20 0 0 0 0 S 0.3 0.0 0:01.93 kworker/0:0

1 root 20 0 125332 3828 2496 S 0.0 0.1 0:04.48 systemd

2 root 20 0 0 0 0 S 0.0 0.0 0:00.33 kthreadd

top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,常用于服务端性能分析。

第一行数据相当于uptime命令输出。11:00:54是当前时间,up 54 days,23:55 是系统已经运行的时间,6 users表示当前有6个用户在登录,load average:16.32,18.75,21.04分别表示系统一分钟平均负载,5分钟平均负载,15分钟平均负载。

平均负载

平均负载表示的平均活跃进程数,包括正在running的进程数,准备running(就绪态)的进程数,和处于不可中断睡眠状态的进程数。如果平均负载数刚好等于CPU核数,那证明每个核都能得到很好的利用,如果平均负载数大于核数证明系统处于过载的状态,通常认为是超过核数的70%认为是严重过载,需要关注。还需结合1分钟平均负载,5分钟平均负载,15分钟平均负载看负载的趋势,如果1分钟负载比较高,5分钟和15分钟的平均负载都比较低,则说明是瞬间升高,需要观察。如果三个值都很高则需要关注下是否某个进程在疯狂消耗CPU或者有频繁的IO操作,也有可能是系统运行的进程太多,频繁的进程切换导致。比如说上面的演示环境是一台8核的centos机器,证明系统是长期处于过载状态在运行。

第二行的Tasks信息展示的系统运行的整体进程数量和状态信息。102 total 表示系统现在一共有102个用户进程,1 running 1个进程正在处于running状态,101 sleeping 表示101 个进程正处于sleeping状态,0 stopped 表示 0 个进程正处于stopped状态,0 zombie表示 有0个僵尸进程。

第3行的%Cpu(s)表示的是总体CPU使用情况。

us user 表示用户态的CPU时间比例

sy system 表示内核态的CPU时间比例

ni nice 表示运行低优先级进程的CPU时间比例

id idle 表示空闲CPU时间比例

wa iowait 表示处于IO等待的CPU时间比例

hi hard interrupt 表示处理硬中断的CPU时间比例

si soft interrupt 表示处理软中断的CPU时间比例

st steal 表示当前系统运行在虚拟机中的时候,被其他虚拟机占用的CPU时间比例。

第4,5行显示的是系统内存使用情况。单位是KiB。totol 表示总内存,free 表示没使用过的内容,used是已经使用的内存。buff表示用于读写磁盘缓存的内存,cache表示用于读写文件缓存的内存。avail表示可用的应用内存。

第6行开始往后表示的是具体的每个进程状态:

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

PID 进程ID

USER 进程所有者的用户名,例如root

PR 进程调度优先级

NI 进程nice值(优先级),越小的值代表越高的优先级

VIRT 进程使用的虚拟内存

RES 进程使用的物理内存(不包括共享内存)

SHR 进程使用的共享内存

CPU 进程使用的CPU占比

MEM 进程使用的内存占比

TIME 进程启动后到现在所用的全部CPU时间

COMMAND 进程的启动命令(默认只显示二进制,top -c能够显示命令行和启动参数)

4.3 内存性能评估

  • free指令监控内存

[root@localhost ~]# free -m

total used free shared buff/cache available

Mem: 3774 560 2844 8 370 2957

Swap: 511 0 511

[root@localhost ~]#

一般有这样一个经验公式:应用程序可用内存/系统物理内存>70%时,表示系统内存资源非常充足,不影响系统性能,应用程序可用内存/系统物理内存<20%时,表示系统内存资源紧缺,需要增加系统内存

20%<应用程序可用内存/系统物理内存<70%时,表示系统内存资源基本能满足应用需求,暂时不影响系统性能。

4.4 磁盘I/O性能评估

  • iostat命令

iostat被用于监视系统输入输出设备和CPU的使用情况。它的特点是汇报磁盘活动统计情况,同时也会汇报出CPU使用情况。

[root@localhost ~]# iostat

-bash: iostat: command not found

[root@localhost ~]# yum -y install sysstat

[root@localhost ~]# iostat -d 1 10 #没隔1秒,持续10次

Linux 3.10.0-693.el7.x86_64 (localhost.localdomain) 06/11/2021 x86_64 (2 CPU)

Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn

sda 0.08 1.36 0.66 304530 146757

scd0 0.00 0.00 0.00 1028 0

dm-0 0.00 0.01 0.00 2228 0

对上面每项的输出解释如下:

kB_read/s表示每秒读取的数据块数。

kB_wrtn/s表示每秒写入的数据块数。

kB_read表示读取的所有块数。

kB_wrtn表示写入的所有块数。

可以通过kB_read/s和kB_wrtn/s的值对磁盘的读写性能有一个基本的了解,如果kB_wrtn/s值很大,表示磁盘的写操作很频繁,可以考虑优化磁盘或者优化程序,如果kB_read/s值很大,表示磁盘直接读取操作很多,可以将读取的数据放入内存中进行操作。

  • sar 命令系统运行状态统计

通过sar -d组合,可以对系统的磁盘IO做一个基本的统计,请看下面的一个输出

[root@localhost ~]# sar -d 2 6

Linux 3.10.0-693.el7.x86_64 (localhost.localdomain) 06/11/2021 x86_64 (2 CPU)

05:46:58 AM DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util

05:47:00 AM dev8-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

05:47:00 AM dev11-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

05:47:00 AM dev253-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

需要关注的几个参数含义:

await表示平均每次设备I/O操作的等待时间(以毫秒为单位)。

svctm表示平均每次设备I/O操作的服务时间(以毫秒为单位)。

%util表示一秒中有百分之几的时间用于I/O操作。

对以磁盘IO性能,一般有如下评判标准:

正常情况下svctm应该是小于await值的,而svctm的大小和磁盘性能有关,CPU、内存的负荷也会对svctm值造成影响,过多的请求也会间接的导致svctm值的增加。

await值的大小一般取决与svctm的值和I/O队列长度以及I/O请求模式,如果svctm的值与await很接近,表示几乎没有I/O等待,磁盘性能很好,如果await的值远高于svctm的值,则表示I/O队列等待太长,系统上运行的应用程序将变慢,此时可以通过更换更快的硬盘来解决问题。

%util项的值也是衡量磁盘I/O的一个重要指标,如果%util接近100%,表示磁盘产生的I/O请求太多,I/O系统已经满负荷的在工作,该磁盘可能存在瓶颈。长期下去,势必影响系统的性能,可以通过优化程序或者通过更换更高、更快的磁盘来解决此问题。

4.5 网络性能评估

  • 常用命令

通过ping命令 检测网络的连通性;

通过netstat –i 组合检测网络接口状况;

通过netstat –r组合 检测系统的路由表信息;

通过sar -n组合 显示系统的网络运行状态;

通过iftop -i eth0 查看网卡流量;

fping 检测主机是否存在

  • iftop 命令

iftop是一款实时流量监控工具,监控TCP/IP连接等,缺点就是无报表功能。必须以root身份才能运行

[root@localhost ~]# yum -y install iftop

[root@localhost ~]# iftop #默认监控第一块网卡的流量

[root@localhost ~]# iftop -i ens33 #指定监控ens33网卡流量

[root@localhost ~]# iftop -n #直接显示IP, 不进行DNS反解析

  • fping 命令

检测192.168.1.1到192.168.1.10之间的主机是否存在:

[root@localhost ~]# fping -a -g 192.168.1.1 192.168.1.10

检测192.168.1.1/24的主机是否存在:

[root@localhost ~]# fping -a -g 192.168.1.1/24

将IP列表放在一个文件里面,通过读取文件来检测列表里的主机是否存在:

[root@localhost ~]# fping -a -f ip.txt

检测www.baidu.com是否存在:

[root@localhost ~]# fping www.baidu.com

在这里插入图片描述

5.系统优化实战


5.1找出系统中使用CPU最多的进程

  • 方法1

运行top , 找出使用CPU最多的进程 ,按大写的P,可以按CPU使用率来排序显示

  • 方法2

按照实际使用CPU,从大到小排序显示所有进程列表

[root@localhost ~]# ps -aux --sort -pcpu | more

USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND

root 647 0.1 0.1 305032 6196 ? Ssl Jun08 4:11 /usr/bin/vmtoolsd

root 1 0.0 0.0 125332 3844 ? Ss Jun08 0:04 /usr/lib/systemd/system

d --switched-root --system --deserialize 21

root 2 0.0 0.0 0 0 ? S Jun08 0:00 [kthreadd]

root 3 0.0 0.0 0 0 ? S Jun08 0:00 [ksoftirqd/0]

root 5 0.0 0.0 0 0 ? S< Jun08 0:00 [kworker/0:0H]

root 6 0.0 0.0 0 0 ? S Jun08 0:02 [kworker/u256:0]

root 7 0.0 0.0 0 0 ? S Jun08 0:01 [migration/0]

root 8 0.0 0.0 0 0 ? S Jun08 0:00 [rcu_bh]

root 9 0.0 0.0 0 0 ? S Jun08 0:20 [rcu_sched]

root 10 0.0 0.0 0 0 ? S Jun08 0:02 [watchdog/0]

root 11 0.0 0.0 0 0 ? S Jun08 0:02 [watchdog/1]

root 12 0.0 0.0 0 0 ? S Jun08 0:01 [migration/1]

root 13 0.0 0.0 0 0 ? S Jun08 0:00 [ksoftirqd/1]

root 15 0.0 0.0 0 0 ? S< Jun08 0:00 [kworker/1:0H]

注: -pcpu 可以显示出进程绝对路径,方便找出木马程序运行的路径

在这里插入图片描述

5.2 找出系统中使用内存最多的进程

  • 方法1

使用top命令

运行top , 然后按下大写的M 可以按内存使用率来排序显示

  • 方法2

按照实际使用内存,从大到小排序显示所有进程列表

[root@localhost ~]# ps -aux --sort -rss | more 降序

[root@localhost ~]# ps -aux --sort rss | more 升序

[root@localhost ~]# ps -aux --sort -rss | more

USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND

mysql 31977 0.0 11.8 1183068 456476 ? Sl Jun10 0:16 /usr/local/mysql55/bin/

mysqld --basedir=/usr/local/mysql55 --datadir=/data/mysql --plugin-dir=/usr/local/mysql55

/lib/plugin --user=mysql --log-error=/data/mysql/localhost.localdomain.err --pid-file=/da

ta/mysql/localhost.localdomain.pid

root 901 0.0 0.4 562428 16576 ? Ssl Jun08 0:32 /usr/bin/python -Es /us

r/sbin/tuned -l -P

root 911 0.0 0.3 610356 13988 ? Ssl Jun08 0:00 /usr/sbin/libvirtd

polkitd 661 0.0 0.2 534264 10184 ? Ssl Jun08 0:00 /usr/lib/polkit-1/polki

td --no-debug

root 663 0.0 0.2 695264 9332 ? Ssl Jun08 0:21 /usr/sbin/NetworkManage

r --no-daemon

root 645 0.0 0.2 212120 8588 ? Ssl Jun08 0:17 /usr/sbin/rsyslogd -n

root 464 0.0 0.1 36828 6548 ? Ss Jun08 0:09 /usr/lib/systemd/system

d-journald

在这里插入图片描述

5.3 找出系统中对磁盘读写最多的进程

  • 查看系统中哪个磁盘或分区最繁忙?

对于这个服务器,8块磁盘中,哪个硬盘最繁忙?哪个分区最繁忙?

通过iostat命令查看IO是否存在瓶颈

[root@localhost ~]# iostat -d -k -p /dev/sda

Linux 3.10.0-693.el7.x86_64 (localhost.localdomain) 06/11/2021 x86_64 (2 CPU)

Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn

sda 0.08 1.35 0.67 305166 151035

sda1 0.02 0.13 0.01 29849 2088

sda2 0.00 0.01 0.00 2500 0

sda3 0.06 1.20 0.66 270744 148946

测试: 给磁盘写入一些内容, 写入时尽可能不读磁盘

读入的数据用/dev/zero ,/dev/zero不会读磁盘的。

sync #把内存中的数据快速写到磁盘上。

只做dd不执行sync,不容易看不出写入效果

[root@localhost ~]# dd if=/dev/zero of=h.txt bs=10M count=1000;sync

^C79+0 records in

79+0 records out

828375040 bytes (828 MB) copied, 32.059 s, 25.8 MB/s

再次查看

[root@localhost ~]# iostat -p sda -dk

Linux 3.10.0-693.el7.x86_64 (localhost.localdomain) 06/11/2021 x86_64 (2 CPU)

Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn

sda 0.09 1.35 2.87 305242 650691

sda1 0.02 0.13 0.01 29849 2088

sda2 0.00 0.01 0.00 2500 0

sda3 0.07 1.20 2.86 270820 648602

[root@localhost ~]#

  • iotop命令,查看哪个进程使用磁盘读写最多

[root@localhost ~]# yum -y install iotop

[root@localhost ~]# iotop -o -d 1

o 只显示有io操作的进程

-b 批量显示,无交互,主要用作记录到文件

-n NUM 显示NUM次,主要用于非交互式模式

-d SEC 间隔SEC秒显示一次

-p PID 监控的进程pid

-u USER 监控的进程用户

在这里插入图片描述

5.4 找出系统中使用网络最多的进程

  • nload 监控总体带宽使用情况

[root@localhost ~]# yum install nload -y #安装nload工具

[root@localhost ~]# nload #开启监控

另外重新打开一个终端,然后产生一些测试数据

[root@localhost ~]# ab -n 1000 -c 2 http://www.baidu.com/index.html

测试结果

[root@localhost ~]# nload

Device ens33 [192.168.10.10] (1/2):

=========================================================================================

Incoming:

Curr: 28.07 MBit/s

Avg: 28.07 MBit/s

Min: 28.07 MBit/s

Max: 28.07 MBit/s

Ttl: 145.24 MByte

Outgoing:

Curr: 350.62 kBit/s

为了做好运维面试路上的助攻手,特整理了上百道 【运维技术栈面试题集锦】 ,让你面试不慌心不跳,高薪offer怀里抱!

这次整理的面试题,小到shell、MySQL,大到K8s等云原生技术栈,不仅适合运维新人入行面试需要,还适用于想提升进阶跳槽加薪的运维朋友。

本份面试集锦涵盖了

  • 174 道运维工程师面试题
  • 128道k8s面试题
  • 108道shell脚本面试题
  • 200道Linux面试题
  • 51道docker面试题
  • 35道Jenkis面试题
  • 78道MongoDB面试题
  • 17道ansible面试题
  • 60道dubbo面试题
  • 53道kafka面试
  • 18道mysql面试题
  • 40道nginx面试题
  • 77道redis面试题
  • 28道zookeeper

总计 1000+ 道面试题, 内容 又全含金量又高

  • 174道运维工程师面试题

1、什么是运维?

2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的?

3、现在给你三百台服务器,你怎么对他们进行管理?

4、简述raid0 raid1raid5二种工作模式的工作原理及特点

5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别,工作中你怎么选择?

7、Tomcat和Resin有什么区别,工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

keeper**

总计 1000+ 道面试题, 内容 又全含金量又高

  • 174道运维工程师面试题

1、什么是运维?

2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的?

3、现在给你三百台服务器,你怎么对他们进行管理?

4、简述raid0 raid1raid5二种工作模式的工作原理及特点

5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别,工作中你怎么选择?

7、Tomcat和Resin有什么区别,工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 14
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值