SpringCloud Gateway UnknownHostException 问题

  • SpringBoot 2.1.4.RELEASE
  • SpringCloud Greenwich.SR2
  • Gateaway框架:SpringCloud Gateway

服务模型

各个主机间通过 主机名称 进行相互访问,并在在每台主机上配置其他主机的主机名对应的IP。
在这里插入图片描述

服务有三台服务主机构成:

  • 主机1:运行了网关服务,通过网关服务访问其他服务。
  • 主机2:运行了一个文件上传处理的耗时服务。
  • 测试发起主机:发起大量并发测试请求。

错误描述

在触发该问题之前先是出现了,Too many open files 的错误

Caused by: io.netty.channel.ChannelException: io.netty.channel.unix.Errors$NativeIoException: newSocketStream(..) failed: Too many open files
	at io.netty.channel.unix.Socket.newSocketStream0(Socket.java:439) ~[netty-transport-native-unix-common-4.1.34.Final.jar!/:4.1.34.Final]
	at io.netty.channel.epoll.LinuxSocket.newSocketStream(LinuxSocket.java:184) ~[netty-transport-native-epoll-4.1.34.Final-linux-x86_64.jar!/:4.1.34.Final]
	at io.netty.channel.epoll.EpollSocketChannel.<init>(EpollSocketChannel.java:45) ~[netty-transport-native-epoll-4.1.34.Final-linux-x86_64.jar!/:4.1.34.Final]
	... 109 common frames omitted
Caused by: io.netty.channel.unix.Errors$NativeIoException: newSocketStream(..) failed: Too many open files
	at io.netty.channel.unix.Errors.newIOException(Errors.java:122) ~[netty-transport-native-unix-common-4.1.34.Final.jar!/:4.1.34.Final]
	... 112 common frames omitted

在压力持续保持的情况下,错误变更为:

2021-04-12 12:02:25.746 ERROR [gateway-mock,60555a50e007872e,60555a50e007872e,true] 13391 --- [or-http-epoll-6] a.w.r.e.AbstractErrorWebExceptionHandler : [01fd016c] 500 Server Error for HTTP POST "/mock/"

java.net.UnknownHostException: kkk
	at java.net.InetAddress.getAllByName0(InetAddress.java:1281) ~[na:1.8.0_275]
	at java.net.InetAddress.getAllByName(InetAddress.java:1193) ~[na:1.8.0_275]
	at java.net.InetAddress.getAllByName(InetAddress.java:1127) ~[na:1.8.0_275]
	at java.net.InetAddress.getByName(InetAddress.java:1077) ~[na:1.8.0_275]
	at io.netty.util.internal.SocketUtils$8.run(SocketUtils.java:146) ~[netty-common-4.1.34.Final.jar!/:4.1.34.Final]
	at io.netty.util.internal.SocketUtils$8.run(SocketUtils.java:143) ~[netty-common-4.1.34.Final.jar!/:4.1.34.Final]
	at java.security.AccessController.doPrivileged(Native Method) ~[na:1.8.0_275]
	at io.netty.util.internal.SocketUtils.addressByName(SocketUtils.java:143) ~[netty-common-4.1.34.Final.jar!/:4.1.34.Final]
	at io.netty.resolver.DefaultNameResolver.doResolve(DefaultNameResolver.java:43) ~[netty-resolver-4.1.34.Final.jar!/:4.1.34.Final]
	at io.netty.resolver.SimpleNameResolver.resolve(SimpleNameResolver.java:63) ~[netty-resolver-4.1.34.Final.jar!/:4.1.34.Final]
	at io.netty.resolver.SimpleNameResolver.resolve(SimpleNameResolver.java:55) ~[netty-resolver-4.1.34.Final.jar!/:4.1.34.Final]
	at io.netty.resolver.InetSocketAddressResolver.doResolve(InetSocketAddressResolver.java:57) ~[netty-resolver-4.1.34.Final.jar!/:4.1.34.Final]
	at io.netty.resolver.InetSocketAddressResolver.doResolve(InetSocketAddressResolver.java:32) ~[netty-resolver-4.1.34.Final.jar!/:4.1.34.Final]
	....

原因

linux每建立一个TCP连接都需要打开一个文件句柄,使用这个文件句柄来代表连接。

由于linux系统文件打开数量是有上限的,在压测过程中由于服务处理能力较弱,而测试主机发起速度比较快(消费者速度 > 生产者速度),导致大量连接没有处理完成。

因此存在了大量的打开状态的文件句柄。

由 域名 到解析到IP这个过程中很有可能需要发生文件读取,在到达上限打开文件上限之后,因为没有
可以打开的文件,所以出现 java.net.UnknownHostException 异常。

我们可以通过命令查看当前主机的文件打开数量:

ulimit -a

在这里插入图片描述
open files 也就是文件打开数量。

当然我们可以通过手动调大打开数的方式在一定程度解决该问题:

sudo ulimit -n 65535

注意在修改了参数之后一定要重启java程序使配置生效。

上面的配置在服务器重启之后就会失效,需要重启也生效,需要调整配置/etc/security/limits.conf文件。

向文件/etc/security/limits.conf中追加下面内容

sudo echo "* soft nofile 65535"  >> /etc/security/limits.conf
sudo echo "* hard nofile 65535"  >> /etc/security/limits.conf
  • 表示所用的用户

分析

该问题实际上是处理能力不足造成,加大文件打开数量只是缓解了该问题出现的时间,随着压力的持续增加,仍然还是会出现该问题,因此最好的办法是了解生产环境中的压力情况,看看是不是采用用一些消峰或者优化代码的方式解决。

但是最简单的和有效的解决办法任然还是修改文件打开的上限。

我个人认为最好的办法应该是增加机器,负载均衡,把压力负载开,那么每台主机上都能够保持比较健康的文件打开数量。

参考文献

  1. 博客园 . Linux最大文件打开数 . UnixFBI 运维特工 . 2016.8 . https://www.cnblogs.com/pangguoping/p/5791432.html
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在这个错误信息中,出现了UnknownHostException,意味着发生了无法识别的主机异常。具体来说,在这个例子中,发生了一个GET请求的I/O错误,该请求的目标是"http://spring-cloud-producer/hello",但是由于无法解析主机名"spring-cloud-producer",所以导致了这个异常的抛出。 这个错误的解决方法是在服务消费方的pom文件中添加依赖,例如在Spring Cloud应用中,可以添加以下依赖项: ```xml <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-loadbalancer</artifactId> </dependency> ``` 这个依赖项可以解决UnknownHostException异常,因为它提供了负载均衡的功能,使得服务消费方能够正确解析服务提供方的主机名。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [nacos springcloud 集成java.net.UnknownHostException: spring-cloud-producer](https://blog.csdn.net/jingyu333/article/details/124873256)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Spring Cloud Alibaba 服务消费者调用 nacos 服务报错:java.net.UnknownHostException: xxx](https://blog.csdn.net/qq_42971035/article/details/124822337)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值