ntpdate代码:
https://github.com/ntp-project/ntp/tree/stable/ntpdate
编译:
1)./bootstrap
2)autoconf automake configure make,预先安装libtool
问题现象:
在v3.2版本超融合中,osd、mon、controller、compute分别在cron下执行了类型下面的cron语句:
*/3 * * * * root /usr/sbin/ntpdate 10.42.112.157;/sbin/hwclock -w;
但是偶现ntpdate no server suitable for synchronization found 的错误。
正常应该如下:
问题原因:
osd、mon、controller、compute均是主机网络,而ntpd在hcs-server,hcs-server是rancher网络。
osd、mon、controller、compute访问10.42.x.x时,走docker0 路由,即:
访问ntpd时,发送的报文为:
可以看见,src为docker0的10.42.0.1 ip,目的ip和端口正确。但有个问题是,若osd、mon这些同时执行呢?
这时候会出现内核区分不了到底报文该分发给哪个上层应用程序,导致明明回复给mon的ntp应答,被osd的socket收走。
ntpdate发送的代码如下:
1)创建一个socket,并绑定至本地的123端口(在不用-u参数的情况)
addr就是从ntp的rfc中拿到的123端口,ntpdate程序把该socket绑定到了本端的123,而远端ntp也是123,就是出现了上处srcport = dstport =123 的情形
而-u的情形,本地socket不绑定本端123,这时候发送端的srcport由内核随机分配。
2)发送ntp请求。
so,出现上述多个cron同时执行时,最好加上-u参数,区别不同的ntpdate应用程序在同一时刻进行同步的情形。