银河麒麟V10SP1Nginx代理转发故障socket() failed (24: Too many open files)修改操作系统ulimit值解决实战

银河麒麟V10SP1Nginx代理转发故障socket() failed (24: Too many open files)修改操作系统ulimit值解决实战

一、事故描述

Nginx转发失败,转发代理服务器宕机!
翻看Nginx日志

/var/log/nginx

在这里插入图片描述
日志大量报错如下:

在这里插入图片描述

socket() failed (24: Too many open files) while connecting to upstream

这个是操作系统的openfiles值没有配置,达到了最大值,解决方法就是要调整操作系统的参数了!

ulimit 值过小,可能导致压力测试遇到瓶颈,比如通过nginx建立tcp长链接时,链接数量受限。需要修改ulimit值,Linux默认为1024。

Linux open files 限制什么?

在 Linux 中,“open files 限制”指的是对每个进程可以同时打开的文件数量的限制,也称为文件描述符限制。这个限制会影响到系统的性能和稳定性,如果设置太低可能会导致某些应用程序无法正常运行。
Linux 系统中的 open files 限制涉及到单个进程和系统总体两个方面:
单个进程的 open files 限制:可以使用 ulimit -n 命令查看当前用户进程可以同时打开的文件数限制。默认情况下,这个限制通常是 1024。要更改单个进程的文件描述符限制,可以使用 ulimit 命令。例如,执行 ulimit -n 10000 可将文件描述符限制设置为 10000,但这种更改通常只对当前会话生效。若要永久更改此限制,可以编辑 /etc/security/limits.conf 文件,添加类似如下的行:myuser hard nofile 10000 ,这将确保用户 myuser 在登录时可以同时打开最多 10000 个文件。其中,“soft nofile”表示软限制,即用户可以自行修改的最大值;“hard nofile”表示硬限制,是系统设定的最大值,软限制应小于等于硬限制。
系统总 open files 限制:通过查看 /proc/sys/fs/file-max 文件可以得知系统所有进程一共可以打开的文件数量。
当程序(特别是高并发或处理大量文件、网络连接的程序)需要打开的文件数量超过限制时,可能会出现“Too many open files”等错误。常见的解决方法是根据实际需求,适当增大文件描述符限制。但需要注意的是,修改这些参数可能会影响系统性能和稳定性,因此需要谨慎操作,并在修改前备份相关文件和数据。

二、解决方法步骤

(1)查看当前操作系统的配置值

ulimit -a

在这里插入图片描述

(2)调整参数

vi /etc/security/limits.conf

补下下面的内容:

# End of file

# open files  (-n)
 * soft nofile 20480
 * hard nofile 20480
 root soft nofile 20480
 root hard nofile 20480
#
# # max user processes   (-u)
 * soft nproc 20480
 * hard nproc 20480
 root soft nproc 20480
 root hard nproc 20480


在这里插入图片描述
关闭当前SSH会话,重新登录
在执行

ulimit -a

在这里插入图片描述
上图的没有配置值:

在这里插入图片描述
下图值已经变了!

(3)重启Nginx服务

systemctl start nginx.service    #启动服务

再观察翻看日志是否还存在socket() failed (24: Too many open files)报错问题解决

/var/log/nginx

在这里插入图片描述
再观察翻看日志是否还存在socket() failed (24: Too many open files)报错问题解决!

当 Nginx 出现socket() failed (24: Too many open files) while connecting to upstream错误时,通常是因为系统设置的可打开文件描述符数量限制过小,导致 Nginx 进程在尝试打开更多文件时遇到了限制。可以通过以下方法来解决:

  1. 修改系统的 ulimit 限制:

    • 直接执行命令ulimit -n 65535,将同一时间最多可开启的文件数修改为 65535,可以根据自身情况适当调整该数值。但此方法只对当前 shell 有效,退出后失效。
    • 若要永久生效,需要修改/etc/security/limits.conf文件,在底部加入以下配置:
    * soft nproc 65535
    * hard nproc 65535
    * soft nofile 65535
    * hard nofile 65535
    

    其中,*代表全局;soft表示软件限制;hard表示硬件限制;nproc是最大进程数;nofile是最大文件打开数。修改后需要重启系统才能生效。

  2. 修改 Nginx 的配置:在 Nginx 的主配置文件(通常是nginx.conf)中加入或修改以下行:

    worker_rlimit_nofile 65535;
    

    然后重新加载 Nginx 配置,使修改生效,例如使用nginx -s reload命令。

worker_rlimit_nofile 参数用于为 Nginx 工作进程改变打开最多文件描述符数目的限制,可在不重启主进程的情况下增加限制。

修改系统文件描述符数量时,应根据实际情况进行调整,过大的数量可能会对系统性能造成影响。同时,还需注意检查 Nginx 上游服务器或相关服务是否存在异常,以确保问题得到彻底解决。如果问题仍然存在,可以进一步查看系统日志和相关指标,以确定是否还有其他潜在的问题。另外,也可以使用lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr|more命令查看当前系统打开的文件句柄情况,帮助分析是否有其他进程占用了过多的文件描述符。

额外方法
补充nginx的配置

vi /etc/nginx/nginx.conf

worker_rlimit_nofile 65535;

在 Nginx 配置中,worker_rlimit_nofile 65535; 用于指定一个 Nginx 进程可以打开的最多文件描述符数目。这里将其设置为 65535,表示每个 Nginx 进程最多可以同时打开 65535 个文件。

文件描述符是操作系统用于标识和跟踪打开文件或网络连接等资源的一种机制。当 Nginx 作为服务器处理大量并发连接时,它需要打开许多文件或连接,因此需要足够的文件描述符来支持这些操作。

user nginx ; 
worker_processes 8; 
error_log logs/nginx_error.log crit; 
pid logs/nginx.pid; 
worker_rlimit_nofile 65535;  # 配置 worker 进程可以打开的最大描述符数目为 65535

events { 
    use epoll; 
    worker_connections 204800; 
} 

http { 
    include mime.types; 
    default_type application/octet-stream; 
    # 其他 http 相关的配置 
}

配置这个值
Nginx这个值配置也是受限于操作系统的最大值,所以,还是先配置操作系统的比较靠谱!

  • 30
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 当Nginx报错“accept4() failed (24: too many open files)”时,意味着系统打开的文件描述符数量已达到或超过了系统的限制。 文件描述符是操作系统为了管理打开的文件而分配给进程的整数。当一个进程打开文件时,操作系统会为其分配一个文件描述符。这些文件可以是网络连接、文件等。 当Nginx处理请求时,它会用到大量的文件描述符来处理客户端的连接。因此,如果系统的文件描述符限制太低,就会导致Nginx无法创建足够数量的文件描述符来处理客户端连接,从而报错。 解决这个问题的方法是调整系统的文件描述符限制。可以通过以下步骤来增加文件描述符的数量: 1. 打开终端并以管理员身份登录系统。 2. 编辑`/etc/sysctl.conf`文件,使用以下命令打开文件: `sudo nano /etc/sysctl.conf` 3. 在文件的末尾添加以下行: ``` fs.file-max = 65536 ``` 4. 保存并关闭文件。 5. 编辑`/etc/security/limits.conf`文件,使用以下命令打开文件: `sudo nano /etc/security/limits.conf` 6. 在文件的末尾添加以下行: ``` * soft nofile 65536 * hard nofile 65536 ``` 7. 保存并关闭文件。 8. 重启系统,以使更改生效: `sudo reboot` 重启后,系统将具有更高的文件描述符限制,Nginx就能够处理更多的连接而不再报错“accept4() failed (24: too many open files)”。 ### 回答2: 在Nginx的错误日志中,出现"accept4() failed (24: too many open files)"的报错,这意味着系统中打开的文件数已经达到了操作系统允许的最大限制。在Linux系统中,默认情况下,操作系统为每个进程设置了一定的文件打开限制。 引起这个问题的原因可能是Nginx进程打开的文件数超过了操作系统的限制。当Nginx处理许多并发请求时,会为每个连接打开一个文件描述符。如果并发连接数过高或系统文件描述符的限制较低,就可能导致这个问题的发生。 为了解决这个问题,可以采取以下措施: 1. 增加操作系统文件描述符限制:可以通过修改系统的ulimit设置来增加每个进程允许打开的文件数。可以编辑/etc/security/limits.conf文件,并添加以下行: ``` * hard nofile 65535 * soft nofile 65535 ``` 这将将每个进程打开的文件数限制增加到65535。 2. 优化Nginx配置:可以通过调整Nginx的worker_processes和worker_connections参数来避免打开过多的文件。worker_processes应该设置为适当的,以便充分利用系统的处理能力。worker_connections则应根据系统资源和预期的并发连接数进行调整,以避免超出操作系统的限制。 3. 优化系统资源:可以评估系统的资源使用情况,例如CPU、内存和磁盘IO等。如果系统资源不足,可能需要升级硬件或优化其他应用程序以释放资源。 总之,解决Nginx报错"accept4() failed (24: too many open files)"的问题,需要同时优化系统资源和Nginx配置,确保操作系统的文件描述符限制不会成为瓶颈,并合理设置Nginx的并发连接数。 ### 回答3: 当Nginx报错“accept4() failed (24: too many open files)”时,意味着服务器的打开文件数已经超过了系统的限制。 这个错误通常是由于服务器同时处理的连接数太多,导致Nginx无法打开更多的文件而引发的。操作系统对每个进程都设置了最大打开文件数的限制,这个限制可以针对整个系统或者单个用户设置。 要解决这个问题,可以采取以下措施: 1. 增加系统的最大打开文件数限制:可以通过修改操作系统的配置文件来增加最大打开文件数限制。具体的修改方式与操作系统有关,需要参考官方文档或相关论坛进行配置。 2. 优化Nginx配置:可以通过优化Nginx的配置来减少连接数,从而降低打开文件数。比如调整连接超时时间、增加反向代理缓存等。 3. 优化服务器资源:可以通过增加服务器内存、升级硬件等方式来提升服务器的性能和处理能力,从而减少连接数,降低打开文件数。 4. 检查程序中的资源泄漏:有时候,程序中存在资源泄漏会导致打开文件数不断增加。可以通过检查程序的代码,查找并修复可能的资源泄漏问题。 需要注意的是,以上措施必须在对服务器有足够了解的情况下进行操作,避免产生其他不可预料的问题。另外,建议及时监测服务器的打开文件数以及其他性能指标,以便及时发现和解决类似问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

技术很渣

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值