问题现象
配置应用可用性检测,过5min后发现应用还是不可用。
问题分析
检查了agent配置文件后,发现配置参数可以下拉到agent,说明不是配置下来的问题。
排查agent日志发现一直再报数据处理异常的错误。
com.yonyou.yyy.sender.HttpClientUtil.sendPost
com.yonyou.yyy.sender.HttpClientUtil.send
2019-04-28 16:27:48 AvailabilityTool - [ ERROR ] 数据处理异常null
com.yonyou.yyy.exception.NetworkException
at com.yonyou.yyy.sender.HttpClientUtil.sendPost(HttpClientUtil.java:190)
at com.yonyou.yyy.sender.HttpClientUtil.send(HttpClientUtil.java:129)
at
com.yonyou.yyy.sender.HttpClientUtil.send(HttpClientUtil.java:92)
at com.yonyou.yyy.sender.HttpClientSenderDataHandler.process(HttpClientSenderDataHandler.java:47)
at com.yonyou.yyy.datahandler.DefaultDataHandlerContext.process(DefaultDataHandlerContext.java:130)
at com.yonyou.yyy.avail.AvailabilityTool.send(AvailabilityTool.java:404)
at com.yonyou.yyy.avail.AvailabilityTask.execute(AvailabilityTask.java:21)
at org.quartz.core.JobRunShell.run(JobRunShell.java:202)
at org.quartz.simpl.SimpleThreadPool$WorkerThread.run(SimpleThreadPool.java:573)
Caused by: java.lang.NullPointerException
at java.util.concurrent.ConcurrentHashMap.putVal(ConcurrentHashMap.java:1011)
at java.util.concurrent.ConcurrentHashMap.put(ConcurrentHashMap.java:1006)
at com.yonyou.yyy.sender.DefaultProxyRoutePlanner.determineProxy(DefaultProxyRoutePlanner.java:75)
at org.apache.http.impl.conn.DefaultRoutePlanner.determineRoute(DefaultRoutePlanner.java:78)
at com.yonyou.yyy.sender.DynamicProxyRoutePlaner.determineRoute(DynamicProxyRoutePlaner.java:62)
at org.apache.http.impl.client.InternalHttpClient.determineRoute(InternalHttpClient.java:125)
at org.apache.http.impl.client.InternalHttpClient.doExecute(InternalHttpClient.java:184)
at org.apache.http.impl.client.CloseableHttpClient.execute(CloseableHttpClient.java:83)
at org.apache.http.impl.client.CloseableHttpClient.execute(CloseableHttpClient.java:108)
at com.yonyou.yyy.sender.HttpClientUtil.sendPost(HttpClientUtil.java:177)
... 8 more
和研发沟通发现可用性检测的代码启用了代理,监测点跳到公网后去检测内网ip。这样会有个bug。
1、如果有跳板机的话,在应用设置了内网IP检测内网IP:PORT,那么检测点跳到公网,公网和内网网络不通。这样检测异常。
2、如果无跳板机,应用服务器可以直连公网,那么监测点在公网就无影响。
解决办法
让研发在代码中加了一层判断,如果是本机检测并且有跳板机的应用服务器检测本机的url可以不走代理。