你是否还在使用gethostbyname/getaddrinfo进行名字解析呢?
我告诉你,赶紧替换它们吧!换成自己的实现,或者手工写一个朴素的手艺版本。
使用gethostbyname/getaddrinfo这些接口是危险的。请看:
https://skarnet.org/software/s6-dns/getaddrinfo.html
DNS resolution performs network I/O, which can take a non-negligible amount of time. getaddrinfo() is a blocking call and there is no way to specify a timeout to make it return early, so it may block indefinitely. This is bad design.
…
getaddrinfo() is a toy interface. For any half-serious DNS work, another API must be used.
我们设想如下一个case。
首先,DNS解析是可以使用TCP协议来进行的,getaddrinfo内部按照DNS配置的要求使用TCP协议与服务器建立了TCP连接,试图期待服务器在该连接上吐回getaddrinfo所需要的地址信息。
这并不意味着服务器就一定会做正确的事,即便不是故意的,服务器也可能因为bug而 丢失了该TCP连接却没有在协议层面关闭它。
这就是悲剧的根源,getaddrinfo会始终阻塞在TCP的recv调用上,维持着这个僵死的ESTABLISHED状态。
暂且不谈TCP这种我们无法控制对端的情况,我们用另一种方式在本机上打爆getaddrinfo。
我们看代码:
#include <stdlib.h>
#include <string.h>
#include <netdb.h>
int main(int argc, char *argv[])
{
struct addrinfo hints;
struct addrinfo *result;
memset(&hints, 0, sizeof(struct addrinfo));
hints.ai_family = AF_UNSPEC;
hints.ai_socktype = SOCK_DGRAM;
hints.ai_flags = AI_PASSIVE;
getaddrinfo(NULL, argv[1], &hints, &result);
}
我们知道getaddrinfo会打开并读取/etc/services文件。然而如果打不开或者读到数据会怎样?
阻塞了呗,getaddrinfo没有任何超时退出机制,很遗憾。我们试一下:
[root@localhost ~]# mv /etc/services /etc/services.1
[root@localhost ~]# ln -s /dev/zero /etc/services
[root@localhost ~]#
[root@localhost ~]# ./a.out www.abc.com
# 阻塞在这里...
永远返回不了了。如果在你的应用程序中调用了这个toy interface,那么该线程将会就此block。
上面的程序改成下面的样子:
#include <netdb.h>
int main(int argc, char *argv[])
{
gethostbyname(argv[1]);
}
这次是/etc/hosts,如果该文件被hack成了不可open或者read不完的情况,同样会阻塞当前线程:
[root@localhost ~]# ltrace ./a.out wwww
__libc_start_main(0x40051d, 2, 0x7ffd3c90ff58, 0x400550 <unfinished ...>
gethostbyname("wwww"
...
当然了,没人会自己hack掉/etc/services和/etc/hosts,也没人会允许别人hack自己的机器,这里举这个例子是为了说明, 如果发生了令人遗憾的情况,getaddrinfo没有任何措施可以返回。
法律要存在,枪不也必不可少么?
gethostbyname/getaddrinfo是个传销接口,你看它们多么简单易用,你梦想着得到收益,然而,一旦进去或许就出不来了。
当然,经理不会关注这些。
浙江温州皮鞋👞湿,下雨☔️进水不会胖。