环境描述:

1.      操作系统:CentOS6,CentOS7,Ubuntu

2.      DNS202.106.0.20【北京联通】,202.106.196.115【北京联通】,114.114.114.114114DNS

 

陆续收到研发、测试部门反馈,内网SSH登录忽然变慢了,会卡在登录界面很久;

紧接着又收到反馈,MySQL使用客户端连接不上,或者连接很慢;

再接着,程序连接zookeepr&kafka超时情况时有发生;

 

很明显的DNS解析问题,SSH 可以在配置文件/etc/ssh/ssh_config 中更改UseDNS=no MySQL中在配置文件中增加--skip-name-resolve解决。

 

但问题是,以前都是好好的,为什么忽然就出问题了呢?而且正在使用的几个DNS服务正常,用压测工具dnsperf测试也没发现问题。

 

通过了解SSH登录过程发现,当客户端SSH登录时,服务器端会对客户端的IP地址做反向解析,实测这几个DNS的反向解析:

 

[root@ops]#  dig-x 10.23.1.1 @202.106.0.20
; <<>> DiG 9.9.4-RedHat-9.9.4-18.el7<<>> -x 10.23.1.1 @202.106.0.20
;; global options: +cmd
;; connection timed out; no servers could be reached
 
[root@ops]#  dig-x 10.23.1.1 @202.106.196.115
; <<>> DiG 9.9.4-RedHat-9.9.4-18.el7<<>> -x 10.23.1.1 @202.106.196.115
;; global options: +cmd
;; connection timed out; no servers could be reached
 
[root@ops]#  dig-x 10.23.1.1 @114.114.114.114
; <<>> DiG 9.9.4-RedHat-9.9.4-18.el7<<>> -x 10.23.1.1 @114.114.114.114
;; global options: +cmd
;; connection timed out; no servers could be reached


全部timeout ,自此问题原因找到,是因为正在使用的几个DNS不知什么原因,不再支持DNS的反向解析,导致服务连接过程中会有个15秒的超时等待。从而导致内网服务异常。

 

解决办法很简单,更换成腾讯和阿里的两个支持反向解析的DNS后,问题解决。

119.29.29.29         #腾讯,DNSPOD    

223.5.5.5             #阿里

 

[root@ops]#  dig-x 10.23.1.1 @119.29.29.29
; <<>> DiG 9.9.4-RedHat-9.9.4-18.el7<<>> -x 10.23.1.1 @119.29.29.29
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status:NXDOMAIN, id: 18963
;; flags: qr aa rd ra; QUERY: 1, ANSWER: 0, AUTHORITY:1, ADDITIONAL: 1
 
;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 4096
;; QUESTION SECTION:
;1.1.23.10.in-addr.arpa.                IN      PTR
 
;; AUTHORITY SECTION:
10.in-addr.arpa.       10800   IN      SOA    localhost. nobody.invalid. 1 3600 1200 604800 10800
 
;; Query time: 73 msec
;; SERVER: 119.29.29.29#53(119.29.29.29)
;; WHEN: Thu Oct 20 15:17:14 CST 2016
;; MSG SIZE rcvd: 110