Linux系统性能优化：七个实战经验

最新推荐文章于 2024-07-22 16:09:49 发布

楠枫@@

最新推荐文章于 2024-07-22 16:09:49 发布

阅读量1.2k

点赞数 20

文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/m0_46245085/article/details/136727135

版权

Linux系统的性能是指操作系统完成任务的有效性、稳定性和响应速度。Linux系统管理员可能经常会遇到系统不稳定、响应速度慢等问题，例如在Linux上搭建了一个web服务，经常出现网页无法打开、打开速度慢等现象，而遇到这些问题，就有人会抱怨Linux系统不好，其实这些都是表面现象。

操作系统完成一个任务时，与系统自身设置、网络拓朴结构、路由设备、路由策略、接入设备、物理线路等多个方面都密切相关，任何一个环节出现问题，都会影响整个系统的性能。因此当Linux应用出现问题时，应当从应用程序、操作系统、服务器硬件、网络环境等方面综合排查，定位问题出现在哪个部分，然后集中解决。

随着容器时代的普及和AI技术的颠覆，面对越来越复杂的业务和架构，再加上企业的降本增效已提上了日程，因此对Linux的高性能、可靠性提出了更高的要求，Linux性能优化成为运维人员的必备的核心技能。

例如，主机CPU使用率过高报警，登录Linux上去top完之后，却不知道怎么进一步定位，到底是系统CPU资源太少，还是应用程序导致的问题？这些Linux性能问题一直困扰着我们，哪怕工作多年的资深工程师也不例外。

本文根据社区探讨，整理出企业Linux系统性能优化的7个实战经验，来自社区专家和会员分享，希望对大家有所帮助。

1、影响Linux系统性能的因素一般有哪些？

Linux系统的性能受多个因素的影响。以下是一些常见的影响Linux系统性能的因素：

CPU负载：CPU的利用率和负载水平对系统性能有直接影响。高CPU负载可能导致进程响应变慢、延迟增加和系统变得不稳定。
内存使用：内存是系统运行的关键资源。当系统内存不足时，可能会导致进程被终止、交换分区使用过多以及系统性能下降。
磁盘I/O：磁盘I/O性能是影响系统响应时间和吞吐量的重要因素。高磁盘I/O负载可能导致延迟增加、响应变慢和系统性能下降。
网络负载：网络流量的增加和网络延迟会对系统性能产生影响。高网络负载可能导致网络延迟增加、响应变慢和系统资源竞争。
进程调度：Linux系统使用进程调度器来管理和分配CPU资源。调度算法的选择和配置会影响进程的优先级和执行顺序，从而影响系统的响应能力和负载均衡。
文件系统性能：文件系统的选择和配置对磁盘I/O性能有影响。不同的文件系统可能在性能方面有所差异，适当的文件系统选项和调整可以改善系统性能。
内核参数：Linux内核有许多可调整的参数，可以影响系统的性能和行为。例如，TCP/IP参数、内存管理参数、文件系统缓存等。适当的内核参数调整可以改善系统的性能和资源利用率。
资源限制和配额：在多用户环境中，资源限制和配额的设置可以控制每个用户或进程可使用的资源量。适当的资源管理可以避免某些进程耗尽系统资源而导致性能问题。

这些因素之间相互关联，对系统性能产生综合影响。为了优化Linux系统性能，需要综合考虑并适当调整这些因素，以满足特定的需求和使用情况。

2、工作中有没有快速排除故障的办法？

1.CPU 性能分析

利用 top、vmstat、pidstat、strace 以及 perf 等几个最常见的工具，获取 CPU 性能指标后，再结合进程与 CPU 的工作原理，就可以迅速定位出 CPU 性能瓶颈的来源。

比如说，当你收到系统的用户 CPU 使用率过高告警时，从监控系统中直接查询到，导致 CPU 使用率过高的进程；然后再登录到进程所在的 Linux 服务器中，分析该进程的行为。你可以使用 strace，查看进程的系统调用汇总；也可以使用 perf 等工具，找出进程的热点函数；甚至还可以使用动态追踪的方法，来观察进程的当前执行过程，直到确定瓶颈的根源。

2.内存性能分析

可以通过 free 和 vmstat 输出的性能指标，确认内存瓶颈；然后，再根据内存问题的类型，进一步分析内存的使用、分配、泄漏以及缓存等，最后找出问题的来源。

比如说，当你收到内存不足的告警时，首先可以从监控系统中。找出占用内存最多的几个进程。然后，再根据这些进程的内存占用历史，观察是否存在内存泄漏问题。确定出最可疑的进程后，再登录到进程所在的 Linux 服务器中，分析该进程的内存空间或者内存分配，最后弄清楚进程为什么会占用大量内存。

3.磁盘和文件系统 I/O 性能分析

当你使用 iostat ，发现磁盘 I/O 存在性能瓶颈（比如 I/O 使用率过高、响应时间过长或者等待队列长度突然增大等）后，可以再通过 pidstat、 vmstat 等，确认 I/O 的来源。接着，再根据来源的不同，进一步分析文件系统和磁盘的使用率、缓存以及进程的 I/O 等，从而揪出 I/O 问题的真凶。

比如说，当你发现某块磁盘的 I/O 使用率为 100% 时，首先可以从监控系统中，找出 I/O 最多的进程。然后，再登录到进程所在的 Linux 服务器中，借助 strace、lsof、perf 等工具，分析该进程的 I/O 行为。最后，再结合应用程序的原理，找出大量 I/O 的原因。

4.网络性能分析

而要分析网络的性能，要从这几个协议层入手，通过使用率、饱和度以及错误数这几类性能指标，观察是否存在性能问题。比如：

在链路层，可以从网络接口的吞吐量、丢包、错误以及软中断和网络功能卸载等角度分析；

在网络层，可以从路由、分片、叠加网络等角度进行分析；

在传输层，可以从 TCP、UDP 的协议原理出发，从连接数、吞吐量、延迟、重传等角度进行分析；

比如，当你收到网络不通的告警时，就可以从监控系统中，查找各个协议层的丢包指标，确认丢包所在的协议层。然后，从监控系统的数据中，确认网络带宽、缓冲区、连接跟踪数等软硬件，是否存在性能瓶颈。最后，再登录到发生问题的 Linux 服务器中，借助 netstat、tcpdump、bcc 等工具，分析网络的收发数据，并且结合内核中的网络选项以及 TCP 等网络协议的原理，找出问题的来源。

3、Linux环境下，怎么排查os中系统负载过高的原因瓶颈？

在Linux环境下排查系统负载过高的原因和瓶颈，可以采取以下步骤：

使用top或htop命令观察系统整体负载情况。查看load average的值，分别表示系统在1分钟、5分钟和15分钟内的平均负载。如果负载值超过CPU核心数量的70-80%，表示系统负载过高。
使用top或htop命令查看CPU占用率。观察哪些进程占用了大量的CPU资源。如果有某个进程持续高CPU占用，可能是引起负载过高的原因之一。
使用free命令查看系统内存使用情况。观察内存的使用量和剩余量。如果内存使用量接近或超过物理内存容量，可能导致系统开始使用交换空间（swap），进而影响系统性能。
使用iotop命令查看磁盘I/O使用情况。观察磁盘读写速率和占用率。如果磁盘I/O负载过高，可能导致系统响应变慢。
使用netstat命令或类似工具查看网络连接情况。观察是否存在大量的网络连接或网络流量。如果网络连接过多或网络流量过大，可能影响系统的性能。
检查日志文件。查看系统日志文件（如/var/log/messages、/var/log/syslog）以及应用程序日志，寻找任何异常或错误信息，可能有助于确定导致负载过高的问题。
使用perf或strace等工具进行进程级别的性能分析。这些工具可以帮助你跟踪进程的系统调用、函数调用和性能瓶颈，进一步确定导致负载过高的具体原因。
检查系统的配置和参数设置。审查相关的配置文件（如/etc/sysctl.conf、/etc/security/limits.conf）和参数设置，确保系统的设置与实际需求相匹配，并进行适当的调整。

综合上述步骤，可以帮助你定位系统负载过高的原因和瓶颈，并进一步采取相应的措施来优化系统性能。

4、Linux怎么找出占用负载top5的进程及主要瓶颈在哪个资源（CPU or 内容 or 磁盘 IO）？

CPU 使用排名

ps aux --sort=-%cpu | head -n 5

内存使用排名

ps aux --sort=-%mem | head -n 6

IO 使用排名

iotop -oP

@zwz99999 dcits 系统工程师：

查看最占用 CPU 的 10 个进程

#ps aux|grep -v USER|sort +2|tail -n 10

查看最占用内存的 10 个进程

#ps aux|grep -v USER|sort +3|tail -n 10

iostat 1 10看哪个磁盘busy高

5、Linux的内存计算不准如何解决？

free是执行时间的瞬时计数，/proc/memory内存是实时变化的。

而且free会把缓存和缓冲区内存都计入使用内存，所以会导致看到的可用内存少很多。

准确值的话，建议结合多种监控指标和命令手段去持续观测内存情况。

如：htop 、 nmon 、 syssta、top等，可以结合运维软件和平台，而非站在某个时间点，最好是有一定时间的性能数据积累，从整体趋势和具体问题点位去分析。
内存只是一个资源指标，使用内存的调用才是问题根源。

在一些情况下，通过ps或top命令查看的内存使用累计值与free命令或/proc/meminfo文件中的内存统计值之间可能存在较大差异。这可以由以下原因导致：

缓存和缓冲区：Linux系统使用缓存和缓冲区来提高文件系统性能。这些缓存和缓冲区占用的内存会被标记为"cached"（缓存）和"buffers"（缓冲区）类型。然而，这些内存并不一定是实际被进程使用的内存，而是被内核保留用于提高IO性能。因此，ps或top命令显示的内存使用累计值可能包括了这些缓存和缓冲区，而free命令或/proc/meminfo中的统计值通常不包括它们。
共享内存：共享内存是一种特殊的内存区域，多个进程可以访问和共享它。ps或top命令显示的内存使用累计值可能会包括共享内存的大小，而free命令或/proc/meminfo中的统计值通常不会将其计算在内。
内存回收：Linux系统具有内存回收机制，可以在需要时回收未使用的内存。这意味着一些进程释放的内存可能不会立即反映在ps或top命令显示的内存使用累计值中。相比之下，free命令或/proc/meminfo中的统计值通常更及时地反映实际的内存使用情况。

综上所述，ps或top命令显示的内存使用累计值和free命令或/proc/meminfo中的内存统计值之间的差异通常是由于缓存和缓冲区、共享内存以及内存回收等因素造成的。如果你需要更准确地了解进程实际使用的内存，建议参考free命令或/proc/meminfo中的统计值，并结合其他工具和方法进行综合分析

@wenwen123 项目经理：

在Linux中，可能会出现内存计算不准确的情况，导致ps、top命令中的内存使用累计值与free命令或/proc/meminfo中的内存统计值之间存在较大差异。这种差异可能由以下原因导致：

共享内存：共享内存是多个进程之间共享的一块内存区域，用于进程间通信。共享内存不会被ps、top等工具计算在内存使用量中，因为它们只统计进程的私有内存使用量。因此，如果进程使用了大量的共享内存，它的内存使用量在工具中显示的数值可能较低。
缓存和缓冲区：Linux系统会将一部分内存用于缓存和缓冲区，以提高文件系统和IO操作的性能。这些缓存和缓冲区的内存在ps、top等工具中被视为可回收的，因此它们通常不计入进程的内存使用量中。但是，在free命令或/proc/meminfo中，这些缓存和缓冲区的内存会被纳入统计。
内存回收机制：Linux内核具有内存回收机制，根据需要自动回收和分配内存。这可能导致在ps、top等工具显示的内存使用量和free命令或/proc/meminfo中的统计值之间存在差异。这种差异通常是正常的，并且Linux会动态管理内存以满足系统的需求。

针对内存计算不准确的问题，关注共享内存是合理的。共享内存的使用可能对进程的内存使用量造成影响，但不会被ps、top等工具计算在内存使用量中。如果需要更准确地了解进程的内存使用情况，可以使用专门的工具，如pmap、smem等，这些工具可以提供更详细和准确的内存统计信息。

需要注意的是，Linux内存计算的准确性也取决于内核版本、系统配置和使用的工具等因素。在排查内存计算不准确的问题时，建议使用多个工具进行对比，并结合具体场景和需求进行分析和判断。

6、Swap现在的应用场景还有哪些？

虽然现代计算机的内存容量越来越大，但交换分区（swap）仍然在某些场景下具有重要的应用。以下是一些使用交换分区的常见场景：

内存不足：交换分区作为内存不足时的后备机制，用于将不经常使用或暂时不需要的内存页面转移到磁盘上。当物理内存（RAM）不足以容纳所有活动进程和数据时，交换分区可以提供额外的虚拟内存空间，以避免系统发生内存耗尽错误（Out of Memory）。
休眠/睡眠模式：交换分区在某些操作系统中用于支持休眠（hibernation）或睡眠（suspend）模式。当计算机进入休眠或睡眠状态时，系统的内存状态会被保存到交换分区中，以便在唤醒时恢复到先前的状态。
虚拟化环境：在虚拟化环境中，交换分区可以用于虚拟机的内存管理。当宿主机的物理内存不足时，虚拟机的内存页面可以被交换到宿主机的交换分区，以提供额外的内存空间。
内存回收和页面置换：交换分区可以用于内存回收和页面置换算法。当操作系统需要释放物理内存以满足更紧急的需求时，它可以将不活动的内存页面置换到交换分区中，以便将物理内存分配给更重要的任务或进程。

尽管交换分区在上述场景中发挥作用，但需要注意的是，过度依赖交换分区可能会导致性能下降。频繁的交换操作可能会增加I/O负载，并导致响应时间延迟。因此，在现代系统中，通常建议合理配置物理内存，以尽量减少对交换分区的依赖，并保持足够的内存可用性。

7、在Linux tcp方面有什么调优经验或案例？

centos7-os-init.s
1. #!/bin/sh
2.# Name:centos7-os-init.sh
3.# Write by:Jan
4.# Last Modify:2019-09-20
5.# DESC:Linux系统优化和安全加固
6.#CMD:sh centos7-os-init.sh
7.#CMD说明:该脚本主要用于centos调优，作为相对通用的模板，有一定的普适性，但是一般在实际生产环境
8.##########中会根据系统的不同功能，进行不同的参数优化，请各位注意。
9、#-------------
10.#0添加epel的yum源
>>/etc/yum.repos.d/epel.repo12.##echo "name=Extra Packages for Centos 7-l$basearch">>/etc/yum.repos.d/epel.repo13. ##echo "baseurl=http://centos.ustc.edu.cn/epel/7Server$basearch " >> /etc/yum.repos.d/epel.repo14.##echo "failovermethod=priority">>/etc/yum.repos.d/epel.repo>>/etc/yum.repos.d/epel.repo>>/etc/yum.repos.d/epel.repo
11. ##echo "[epel]
15.##echo"enabled=1
16.##echo "gpgcheck=0
17.###使配置生效
18. ##yum clean all
19.##yum makecache
20.##yum repolist
21. yum install -y wget
22.wget -P /etc/yum.repos.d/ http://mirrors.aliyun.com/repo/epel-7.repo
23. yum clean al!
24. yum makecache
25. yum repolist
26.##或者直接安装 rpm -ivh http://mirrors.aliyun.com/epel/epel-release-latest-7.noarch.rpm27.#1 设定时区，自动同步时间,定义为每天自动同步一次
28. yum install -y ntpdate
29.icp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
30.ntp path='which ntpdate
31. $ntp path 172.16.2.89
32. hwclock -w
33.echo"101***$ntp path 172.16.2.89">>/var/spool/cron/root
34.#设置hostname,一般安装的时候就会设置好
35.
36.#2 创建系统默认目录:
37.##脚本存放目录
38. mkdir -p /u01/shell
39.##软件安装介质存放位置
40. mkdir -p /u01/src
41.##日志存放位置
42.mkdir -p /u02/log
43.##备份存放位置,般也会挂载nas存储盘
44. mkdir -p /u03/bak
45. mkdir -p /u03/nas
46. #mount -t cifs -o username="jan",password="123456a?" //172.16.2.78/DB bak /u03/nas
47
48.#3 优化内核参数
49.##3.1 修改最大系统最大打开文件数和最大进程数
50.echo "*soft nproc 65536 ">>/etc/security/limits.conf51.echo "* hard nproc 65536 ">>/etc/security/limits.con52.echo "* soft nofile 65536 ">>/etc/security/limits.conf53.echo "* hard nofile 65536">>/etc/security/limits.conf
54.echo "*soft nproc65536">/etc/security/limits.d/20-nproc.conf55. echo "rootsoft nprocunlimited">>/etc/security/limits.d/20-nproc.conf
56.
57.echo"测试方式:当前session退出后重新登录执行:ulimit -Sn ulimit -Hn"58.##3.2 调整内核参数、网络参数、安全参数以应对高并发环境。
59.cp /etc/sysctl.conf /etc/sysctl.conf.bk
60.echo ">/etc/sysctl.conf
61.
62.#关闭ipv6
63.echo "net.ipv6.conf.all.disable ipv6 = 1">>/etc/sysctl.conf64.echo "net.ipv6.conf.default.disable ipv6 =1">>/etc/sysctl.conf65.# 避免放大攻击
66.echo "net.ipv4.icmp echo ignore broadcasts = 1">>/etc/sysctl.conf
67.echo "net.ipv4.conf.all.send redirects = 0">>/etc/sysctl.conf
68.echo "net.ipv4.conf.default.send redirects = 0">>/etc/sysctl.conf
69.#开启反向路径过滤
70.echo "net.ipv4.conf.all.rp filter= 1">>/etc/sysctl.conf
71.echo "net.ipv4.conf.default.rp filter = 1">>/etc/sysctl.conf
72.#处理无源路由的包
73.echo "net.ipv4.conf.all.accept source route = 0">>/etc/sysctl.conf
74.echo "net.ipv4.conf.default.accept source route = 0">>/etc/sysctl.conf
75.#关闭sysrq功能
76.echo "kernel.sysrg = 0">>/etc/sysctl.conf
77.#core文件名中添加pid作为扩展名
78.echo "kernel.core uses pid = 1">>/etc/sysctl.conf
79.# 开启SYN洪水攻击保护
80.echo "net.ipv4.tcp syncookies=1">>/etc/sysctl.conf
81.#修改消息队列长度
82.echo "kernel.msgmnb =65536">>/etc/sysctl.conf
83.echo "kernel.msqmax= 65536">>/etc/sysctl.conf
84.#设置最大内存共享段大小bytes，这两个参数主要在安装oracle数据库的时候，结合SGA使用85.echo "kernel.shmmax=17179869184">>/etc/sysctl.conf #建议修改为内存大小例如16G内存86.echo "kernel.shmall =4194304">>/etc/sysctl.conf #默认=kernel.shmmax/4KB(4096)
87.#timewait的数量，默认180000
88.echo "net.ipv4.tcp max tw buckets = 6000">>/etc/sysctl.conf
89.echo "net.ipv4.tcp sack=1">>/etc/sysctl.conf
90.echo "net.ipv4.tcp window scaling= 1">>/etc/sysctl.conf
91.echo "net.ipv4.tcp rmem =4096 87380 4194304">>/etc/sysctl.conf
92.echo "net.ipv4.tcp wmem = 4096 16384 4194304">>/etc/sysctl.conf
93.echo "net.core.wmem default = 8388608">>/etc/sysctl.conf94.echo "net.core.rmem default =8388608">>/etc/sysctl.conf95.echo "net.core.rmem max=16777216">>/etc/sysctl.conf96.echo "net.core.wmem max=16777216">>/etc/sysctl.conf97.#每个网络接口接收数据包的速率比内核处理这些包的速率快时，允许送到队列的数据包的最大数目98.echo "net.core.netdev max backlog = 262144">>/etc/sysctl.conf
99.#限制仅仅是为了防止简单的DoS 攻击
100.echo "net.ipv4.tcp max orphans = 3276800">>/etc/sysctl.conf
101.#未收到客户端确认信息的连接请求的最大值
102.echo "net.ipv4.tcp max syn backlog= 262144">>/etc/sysctl.conf
103.echo "net.ipv4.tcp timestamps =0">>/etc/sysctl.conf
104.#内核放弃建立连接之前发送SYNACK 包的数量
105.echo "net.ipv4.tcp synack retries = 1">>/etc/sysctl.conf
106.#内核放弃建立连接之前发送SYN 包的数量
107.echo "net.ipv4.tcp syn retries = 1">>/etc/sysctl.conf
108.#启用timewait 快速回收
109.echo "net.ipv4.tcp tw recycle =1">>/etc/sysctl.conf
110.#开启重用。允许将TIME-WAIT sockets 重新用于新的TCP 连接
111.echo "net.ipv4.tcp syn retries =1">>/etc/sysctl.conf
112.#启用timewait 快速回收
113.echo "net.ipv4.tcp tw recycle = 1">>/etc/sysctl.conf
114.#开启重用。允许将TIME-WAIT sockets 重新用于新的TCP 连接115.echo "net.ipv4.tcp tw reuse=1">>/etc/sysctl.conf
116.echo "net.ipv4.tcp mem= 94500000 915000000 927000000">>/etc/sysctl.conf
117.echo "netipv4.tcp fin timeout= 1">>/etc/sysctl.conf
118.#当keepalive 起用的时候，TCP 发送keepalive 消息的频度。缺省是2 小时119.echo "net.ipv4.tcp keepalive time= 30">>/etc/sysctl.conf
120.#允许系统打开的端口范围
121.echo "net.ipv4.ip local port range= 32768 65000">>/etc/sysctl.conf
122.#修改防火墙表大小，默认65536
123.#net.netfilter.nf conntrack max=655350
124.#net.netfilter.nf conntrack tcp timeout established=1200
125.# 确保无人能修改路由表
126.echo "net.ipv4.conf.all.accept redirects = 0">>/etc/sysctl.conf127.echo "net.ipv4.conf.default.accept redirects = 0">>/etc/sysctl.conf128.echo "net.ipv4.conf.all.secure redirects = 0">>/etc/sysctl.conf
129.echo "net.ipv4.conf.default.secure redirects = 0">>/etc/sysctl.conf
130.# 开启并记录欺骗，源路由和重定向包
131.echo "net.ipv4.conf.all.log martians =1">>/etc/sysctl.conf132.echo "net.ipv4.conf.default.log martians = 1">>/etc/sysctl.conf
133.echo "fs.file-max=6815744
'>>/etc/sysctl.conf
134.#启用内核中的SYN cookie保护:(一般情况下操作系统已经默认开启)135.echo "1">/proc/sys/net/ipv4/tcp syncookies
136.#优化swap
137.echo"vm.swappiness=10">>/etc/sysctl.conf
138. sysctl -p
139.#4 安全加固相关
140.#4.1 关闭selinux
141. sed -i's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config142.#4.2 关闭不常用服务。根据服务器的用途和安装系统时候的选择进行优化，将不必要的服务关闭，提高性能
143.#chkconfig iptables off
144.#chkconfig ip6tables off
145.#chkconfig abrt-ccpp off
146.#chkconfig abrtd off
147.#chkconfig acpid off
148. #chkconfig atd off
149. #chkconfig auditd off
150. #chkconfig autofs off
151. #chkconfig blk-availability off
152. #chkconfig bluetooth off
153.#chkconfig certmonger off
154.#chkconfig cpuspeed off
155.#chkconfig cups off
156.#chkconfig dnsmasq off
157.#chkconfig firstbootoff off
158. #chkconfig kdump off
159.#chkconfig mdmonitor off
160.#chkconfig netconsoleof off
161. #chkconfig postfix off
162. #chkconfig quota nld off
163.#chkconfig rdisc off
164.#chkconfig restorecond off
165.#chkconfig saslauthd off
166. #chkconfig smartd off
167.#chkconfig wpa supplicantof off
168. #chkconfig ypbind off
169.#4.3 安装监控客户端
170.##安装监控客户端
171.#4.4 清除不必要的系统帐户
172.userdel adm
173.userdel lp
174.userdel sync
175.userdel shutdown
176.userdel halt
177.userdel operator
178.userdel ftp
179.#4.5 隐藏linux版本号
180.#>/etc/issue
181.#>/etc/issue.net
182.#4.6 系统关闭Ping
183.#关闭ping，使系统对ping不做反应，对网络安全大有好处。184.#echo 1>/proc/sys/netipv4/icmp echo ignore _all185.#echo "echo 1>/proc/sys/net/ipv4/icmp echo ignore all">> /etc/rc.d/rc.local186.#恢复系统的Ping响应:
187.#echo 0>/proc/sys/netipv4/icmp echo ignore all
188.###4.7 升级OpenSSH OpenSSL至安全版本189.#######禁止root账户远程登录,更改ssh端口
190.##sed -i's/#Port 22/Port 2022/g'/etc/ssh/sshd config191.##sed -i's/#PermitRootLogin yes/PermitRootLogin no/g' /etc/ssh/sshd config
192.#4.8 安装telnet
193. yum install -y telnet
194.###4.9 创建普通用户,指定/u01 u02 u03所属
195.##groupadd gapp
196.##useradd -g gapp appuser
197.##echo "apuserPWD"|passwd --stdin appuser
198.##chown -R appuser.gapp /u01
199.##chown -R appuser.gapp /u02
200.##chown -R appuser.gapp /u03
201. ##chown -R appuser.gapp /etc/rc.local
202.##chown -R appuser.gapp /etc/rc.d/rc.local
203.##chown -R appuser.gapp /etc/profile
204.##chown -R appuser.gapp /var/spool/cron
205.##chown -R root.root /var/spool/cron/root
206.###4.10 锁定关键文件系统禁止被修改
207.##chattr +i /etc/passwd
208. ##chattr +i /etc/inittab
209.##chattr +i /etc/group
210.##chattr +i /etc/shadow
211.##chattr +i /etc/gshadow
212.##chattr +a /var/log/messages
213.###使用chattr命令后，为了安全我们需要将其改名
214.##mv /usr/bin/chattr /usr/bin/lockkeyfile
215.#4.11 history命令加入时间和操作者IP的属性
216.#echo"HISTFILESIZE=4000">>/etc/profile
217.#echo"HISTSIZE=4000">>/etc/profile
218. #echo 'HISTTIMEFORMAT="%F %T 'who am ilcut -dl( -f2lcut -dl)-f1`whoami' ">>/etc/profile219.#echo "export HISTTIMEFORMAT">>/etc/profile
220.echo "
221.HISTFILESIZE=4000
222.HISTSIZE=4000
223. HISTTIMEFORMAT=!!"%F %T !l'who am ilcut -dll( -f2|cut -dll) -f1ll' il'whoamil' !!"224. export HISTTIMEFORMAT
225.">>/etc/profile
226.source /etc/profile
227.systemctl stop firewalld.service
228.systemctl disable firewalld.service
229.#5 系统重启
230.yuminstall -y gcc
231.rebootzhaoxiaoyong081 平安科技资深工程师：

TCP 优化，分三类情况详细说明：

第一类，在请求数比较大的场景下，你可能会看到大量处于 TIME_WAIT 状态的连接，它们会占用大量内存和端口资源。这时，我们可以优化与 TIME_WAIT 状态相关的内核选项，比如采取下面几种措施。

增大处于 TIME_WAIT 状态的连接数量 net.ipv4.tcp_max_tw_buckets ，并增大连接跟踪表的大小 net.netfilter.nf_conntrack_max。

减小 net.ipv4.tcp_fin_timeout 和 net.netfilter.nf_conntrack_tcp_timeout_time_wait ，让系统尽快释放它们所占用的资源。

开启端口复用 net.ipv4.tcp_tw_reuse。这样，被 TIME_WAIT 状态占用的端口，还能用到新建的连接中。

增大本地端口的范围 net.ipv4.ip_local_port_range 。这样就可以支持更多连接，提高整体的并发能力。

增加最大文件描述符的数量。你可以使用 fs.nr_open 和 fs.file-max ，分别增大进程和系统的最大文件描述符数；或在应用程序的 systemd 配置文件中，配置 LimitNOFILE ，设置应用程序的最大文件描述符数。

第二类，为了缓解 SYN FLOOD 等，利用 TCP 协议特点进行攻击而引发的性能问题，你可以考虑优化与 SYN 状态相关的内核选项，比如采取下面几种措施。

增大 TCP 半连接的最大数量 net.ipv4.tcp_max_syn_backlog ，或者开启 TCP SYN Cookies net.ipv4.tcp_syncookies ，来绕开半连接数量限制的问题（注意，这两个选项不可同时使用）。

减少 SYN_RECV 状态的连接重传 SYN+ACK 包的次数 net.ipv4.tcp_synack_retries。

第三类，在长连接的场景中，通常使用 Keepalive 来检测 TCP 连接的状态，以便对端连接断开后，可以自动回收。但是，系统默认的 Keepalive 探测间隔和重试次数，一般都无法满足应用程序的性能要求。所以，这时候你需要优化与 Keepalive 相关的内核选项，比如：

缩短最后一次数据包到 Keepalive 探测包的间隔时间 net.ipv4.tcp_keepalive_time；

缩短发送 Keepalive 探测包的间隔时间 net.ipv4.tcp_keepalive_intvl；

减少 Keepalive 探测失败后，一直到通知应用程序前的重试次数 net.ipv4.tcp_keepalive_probes。

总结

企业linux 性能优化从来不是一件容易的事，对于运维工程师来说是绕不过去的坎，这也是运维知识体系中最底层并且最难的一部分。想要学习好性能分析和优化，需要建立整体系统性能的全局观，需要理解CPU、内存、磁盘、网络的原理，掌握需要收集哪些监控的指标，以及熟练使用各种工具来分析和追踪以及定位问题。

楠枫@@

关注

20
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
Linux系统性能优化：七个实战经验

企业linux 性能优化从来不是一件容易的事，对于运维工程师来说是绕不过去的坎，这也是运维知识体系中最底层并且最难的一部分。想要学习好性能分析和优化，需要建立整体系统性能的全局观，需要理解CPU、内存、磁盘、网络的原理，掌握需要收集哪些监控的指标，以及熟练使用各种工具来分析和追踪以及定位问题。
复制链接

扫一扫