今天自己的C++服务运行过程中出现了“Too many open files”错误,本文主要描述个人针对该错误的排查过程,不足之处,还请多多指教!
首先Linux上的“Too many open files”从字面上就可以看出来是“打开文件过多”的意思,注意,Linux上一切皆文件,所以不光是常见的文件,还包括sokcet等io。那么打开多少个算过多呢,可以执行ulimit -a查看,其中open files对应的数字即为系统允许单个进程打开的最大文件数,查过该数就会报错,导致进程退出。下面将介绍如何解决该错误。
如果程序没有问题,那么可以通过修改系统允许进程打开的文件数来避免该错误。ulimit -n 4096,将单个进程允许打开的最大文件数改为4096.
如果是程序的问题,那么无论怎么修改,也只能起到延迟报错的作用,最终还是会出现 Too many open files。这种情况,首先查看进程打开了哪些文件句柄, 使用lsof -p 进程id查看,主要关注占比较多的文件信息,比如我的服务发现了很多和某个服务器建立的tcp连接,接下来就是要定位是和哪个服务建立的连接,可以根据端口信息来反推,到对应服务器上执行netstat -nltp|grep 端口,大概就能定位到某个服务了,此时分析服务即可,例如是不是建立了大量的短连接等。
“Too many open files”错误分析
最新推荐文章于 2024-01-24 21:49:50 发布