在测试我们开发的一个 APK(使用了 libevent-2.1.3-alpha 作为网络库) 时发现一个奇怪的问题,域名解析有时报错 Non-recoverable name resolution failure 。在公司偶尔报错,后来程序改动了一下,出错时重试几次,问题没再出现,以为好了。昨天换了个网络环境,结果报错几率变得非常大。
互联网搜索到这个错误的一个处理办法,说在使用 getnameinfo() 函数时需要显式指定其第二个参数 salen 为 sizeof(struct sockaddr_in) 或者 sizeof(struct sockaddr_in6) ,说是 Solaris 和 Android 上的 getnameinfo() 实现不会查看 saddr 中的 sin_family 来计算出真正 salen 。我尝试了一下,没有解决问题,后来想想, libevent 根本就没有使用系统的域名解析函数,完全是自己实现的,于是只好自己跟代码了。
由于远程调试的环境没有搭建起来,只能不断地添加日志,反复查看,非常耗时。最后还真给我找到了问题所在。
libevent 的 dns 解析实现就在 evdns.c 这个文件中,不过如果不懂得 DNS 协议,代码看起来可能比较难懂,我重温了 DNS 协议,然后开始跟代码。
libevent 在处理 DNS 解析时,针对域名引入了一个随机大小写的概念,在 evdns_base_new() 中把 global_randomize_case 默认设置为 1 ,然后在读取域名服务器配置文件时根据里面的 options 来修改。安卓上没有 resolv.conf ,这些选项就没有修正的机会,于是最终 global_randomize_case 还是