问题描述:部署到云服务器ubuntu上时“惊喜”的发现,应用跑几天就宕机了,查看日志发现:
java.io.IOException: Too many open files
at sun.nio.ch.ServerSocketChannelImpl.accept0(Native Method)
at sun.nio.ch.ServerSocketChannelImpl.accept(ServerSocketChannelImpl.java:421)
at sun.nio.ch.ServerSocketChannelImpl.accept(ServerSocketChannelImpl.java:249)
at org.apache.tomcat.util.net.NioEndpoint.serverSocketAccept(NioEndpoint.java:468)
at org.apache.tomcat.util.net.NioEndpoint.serverSocketAccept(NioEndpoint.java:71)
at org.apache.tomcat.util.net.Acceptor.run(Acceptor.java:95)
at java.lang.Thread.run(Thread.java:748)
2021-08-18 06:58:51.815 ERROR [http-nio-8099-Acceptor] --> : Socket accept failed
意思是打开文件太多了。
开始网上各种查询,大部分都是调整Linux句柄数量。但是治标不治本呀。
还是自己调查吧,于是乎一步一步深入
查看进程执行文件命令
lsof -p 进程id
发现一个很陌生的文件一致在追加:
这个文件估计只有Linux专家才能知道是干什么用的,反正我是第一次见到。网上查询无果,最后只能大胆尝试删除。没想到删除以后,应用的进程文件数恢复正常了,进程执行文件不在增加了。
是否有影像只能后续观察了。
如果有知道的小伙伴恭请留言,不胜感激。