Nginx 服务器连接数不足的故障排查和总结

一、问题描述
  • 应用程序通过 Nginx 反向代理后存在访问异常的情况

  • 查看当前连接数,用户访问的高峰期才出现该类异常问题

  • 查看 Nginx 错误日志

    [alert] 3137#3137: *446352 10240 worker_connections are not enough while connecting to upstream, udp client: 3.3.3.3, server: 0.0.0.0:9000, upstream: "1.1.1.2:9997", bytes from/to client:0/0, bytes from/to upstream:0/0
    
二、问题分析
  • 从错误日志和报错环境来看,由于流量的高峰期通过 Nginx 服务来访问后端应用报错提示 Nginx 工作连接数不足

  • 查询官网资料了解到 Nginx 的连接数由如下三个参数决定

    worker_processes
    worker_connections
    worker_rlimit_nofile 
    
    
  • 根据官网资料调整如上两个参数即可解决该问题

三、解决方案
  1. 设置 worker_processes 工作进程数

    设置规则:设置为 CPU 的总核数(CPU总核数 = 物理CPU个数 *️ 每颗物理CPU的核数 )

    P.S

    # 查看物理 CPU 个数
    cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l
    
    # 查看每个物理 CPU 的核数
    cat /proc/cpuinfo| grep "cpu cores"| uniq
    
    # 查看逻辑 CPU 的个数
    cat /proc/cpuinfo| grep "processor"| wc -l
    
    # 查看 CPU 的信息
    cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c
    
    # 查看内存信息
    cat /proc/meminfo
    
  2. 设置 worker_connections 工作连接数

    该参数表示每个进程允许的最多连接数,默认值为 10240 。
    理论上每台 Nginx 服务器的最大连接数为 worker_process * worker_connections 即(CPU总核数 * 10240)

  3. 设置 worker_rlimit_nofile 打开文件最大句柄数

    该参数表示 Nginx 一个进程打开的最多文件数目,理论值为:ulimit -n / worker_processes
    但是 Nginx 分配请求并不是那么均匀,所以一般与 ulimit -n 的值保持一致

四、参考资料
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
当今互联网时代,服务器已经成为了我们日常工作和生活中不可或缺的一部分。而对于开发者来说,如何高效地管理和运营服务器,尤其是在大规模应用和高并发访问时,是一个非常重要的技术挑战。本文将介绍一些与服务器内容相关的技术,包括服务器部署、负载均衡、集群管理等方面的内容。 一、服务器部署 服务器部署是服务器运维工作中最基本的一环。通常情况下,我们需要选择一个合适的操作系统和软件框架,搭建好服务器环境,并进行一些必要的配置和优化。其中,常用的操作系统包括Linux、Windows等,而常用的软件框架包括Apache、Nginx、Tomcat等。 在实际工作中,我们还需要考虑服务器的安全性和稳定性。为了保证服务器的安全性,我们需要进行一些必要的防火墙、安全策略等设置,以保护服务器不受到来自网络的攻击。而为了保证服务器的稳定性,我们需要对服务器的硬件和软件进行监控和维护,及时发现和解决故障和问题。 二、负载均衡 负载均衡是指将请求均匀地分配到多台服务器上,以达到提高系统可用性和性能的目的。在高并发访问时,单一服务器容易出现瓶颈,而负载均衡可以将请求分散到多台服务器上,以实现并发处理。 常用的负载均衡策略包括轮询、最小连接数、IP哈希等。轮询是最简单的负载均衡策略,即将请求依次分配到不同的服务器上。而最小连接数是根据服务器连接数来分配请求,即将请求分配到连接数最少的服务器上。IP哈希是根据请求的IP地址进行哈希,将哈希值与服务器列表中的IP地址进行比较,以确定请求应该分配到哪个服务器上。 三、集群管理 集群管理是指对多台服务器进行统一的管理和维护。在集群管理中,我们需要考虑如何对服务器进行配置、监控、故障排除等工作。常用的集群管理软件包括Zookeeper、Hadoop等。 Zookeeper是一种分布式应用程序协调服务,可以用于配置管理、命名服务、分布式同步、集群管理等方面。Hadoop是一个分布式计算框架,可以用于大规模数据的存储和计算。 在集群管理中,我们还需要考虑如何进行数据备份和恢复。常用的数据备份技术包括数据镜像、数据快照、数据复制等。而数据恢复技术包括数据恢复点、数据备份集等。 四、总结 本文介绍了一些与服务器内容相关的技术,包括服务器部署、负载均衡、集群管理等方面的内容。服务器作为互联网时代的核心基础设施之一,对于开发者来说,熟练掌握服务器相关技术是非常必要的。我们需要不断地学习和实践,以提高自己在服务器运维和管理方面的技术水平。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值