NTP 集群简略部署指南
by 无若
1. NTP 简介
网络时间协议(英语:Network Time Protocol,简称NTP)是在数据网络潜伏时间可变的计算机系统之间通过分组交换进行时钟同步的一个网络协议。自1985年以来,NTP是目前仍在使用的最古老的互联网协议之一。NTP由特拉华大学的David L. Mills设计。
NTP意图将所有参与计算机的协调世界时(UTC)时间同步到几毫秒的误差内。它使用Marzullo算法的修改版来选择准确的时间服务器,其设计旨在减轻可变网络延迟造成的影响。NTP通常可以用公共互联网保持几十毫秒的误差,并且在理想环境的局域网中可以实现超过1毫秒的精度。不对称路由和拥塞控制可能导致100毫秒(或更高)的错误。
2. 规划
使用 NTP 有很几种情况:
情况1:你只有一台服务器,能连接上互联网,那么你在 NTP 中直接配置使用互联网上的授时中心就可以。
情况2:你要为一个集群授时,确保集群中的每个节点时间尽量保持一致。那么,在安装前要在您的集群中对选出一台节点作为授时节点
,其他节点作为被授节点
。此时,如果你的集群如果能连接到互联网,则应该配置集群中的授时节点
为互联网中的授时中心的被授节点
,接收互联网授时中心的授时,在集群内部时,集群中的授时节点
对其他节点进行授时,这是一个层级结构。
下面就展示了这个层级结构,其中 node1 就是集群内部的授时节点
,其他都是被授节点
。
--集群内部----- | node2 | ↗ 互联网授时中心(A)→ → node1 | ↘ | node3 --------------
还有很多情况下是,node1 根本就与 A 不通网络,这种就是典型的内网环境,在这种环境下应该尽量保持集群内部的时间一致,即其他节点与 node1 保持一致。
本文主要就是描述在情况2下的安装部署。
3. 安装部署
假设有 5 个节点,主机名分别为 mdw,sdw01,sdw02,sdw03,sdw04。 那么,在这一集群中,确定 mdw 为授时节点
,其他为被授节点
。
首先登入 mdw,执行安装:
yum -y install ntp
在 mdw 上,给其他节点也进行安装,中间会提示输入密码:
ssh root@sdw01 "yum -y install ntp" ssh root@sdw02 "yum -y install ntp" ssh root@sdw03 "yum -y install ntp" ssh root@sdw04 "yum -y install ntp"
编写一个脚本get_all_host_time.sh
查看所有服务器上的时间:
注意:这个脚本需要 expect 支持,因此需要安装:
yum -y install expect
nano get_all_host_time.sh
注意:登陆所有主机的用户名都是 root,密码都是 1。
#!/bin/bash USER="root" PASS="1" all_hosts="mdw sdw01 sdw02 sdw03 sdw04" for element in $all_hosts do HOST=$element EX_RUN=$(expect -c " spawn ssh $USER@$HOST date \+\%Y\%m\%d\-\%H\%M\%S expect \"password:\" send \"$PASS\r\" interact ") echo "$EX_RUN" & done
编写完成后,执行,发现各个节点的时间差异是较大的:
[root@mdw ~]# source get_all_host_time.sh spawn ssh root@mdw date +%Y%m%d-%H%M%S root@mdw's password: 20170524-155628 spawn ssh root@sdw01 date +%Y%m%d-%H%M%S root@sdw01's password: 20170524-154539 spawn ssh root@sdw02 date +%Y%m%d-%H%M%S root@sdw02's password: 20170524-155629 spawn ssh root@sdw03 date +%Y%m%d-%H%M%S root@sdw03's password: 20170524-154339 spawn ssh root@sdw04 date +%Y%m%d-%H%M%S root@sdw04's password: 20170524-155629
4. 配置授时节点
首先在主节点 mdw 上进行配置,mdw 要被设置成授时节点
:
先设置区域及时区
localectl set-locale LANG=en_US.utf8 #设置系统语言及区域
timedatectl set-timezone Asia/Shanghai #设置时区
有外网条件的可以先更新下 mdw 上的时间,使用的是 cn.pool.ntp.org 上的时间:
[root@mdw ~]# ntpdate cn.pool.ntp.org 24 May 16:31:20 ntpdate[3126]: adjust time server 85.199.214.101 offset -0.008138 sec
没有外网条件的,就看看你的手表,直接设置一下吧:
date -s "2017-05-24 16:38:00"
在设置时间后记得,写一下时间到 BIOS:
hwclock -w
先对配置文件备份2份
cp /etc/ntp.conf /etc/back_ntp.conf cp /etc/ntp.conf /home/ntp.conf
再对 授时节点
mdw 的 ntp 的配置文件进行修改 nano /etc/ntp.conf
:
注释掉以下几个授时服务域名,配置能连通的授时域名 cn.pool.ntp.org
,如果不能连通外网,此项就不要设置;
注意:配置 cn.pool.ntp.org 的时候,上面带的数字代表几个都是可选的NTP授时服务点,NTP会自己选择一个近的。(In most cases it's best to use pool.ntp.org to find an NTP server (or 0.pool.ntp.org, 1.pool.ntp.org, etc if you need multiple server names). The system will try finding the closest available servers for you.)
将本机作为授时节点
,配置 server 127.127.1.0
和 fudge 127.127.1.0 stratum 10
,注意不要修改 IP,这在 NTP 中代表本机:
#server 0.centos.pool.ntp.org iburst #server 1.centos.pool.ntp.org iburst #server 2.centos.pool.ntp.org iburst #server 3.centos.pool.ntp.org iburst server 0.cn.pool.ntp.org iburst server 1.cn.pool.ntp.org iburst server 2.cn.pool.ntp.org iburst server 3.cn.pool.ntp.org iburst server 127.127.1.0 fudge 127.127.1.0 stratum 10
如果没有外网就是这样:
#server 0.centos.pool.ntp.org iburst #server 1.centos.pool.ntp.org iburst #server 2.centos.pool.ntp.org iburst #server 3.centos.pool.ntp.org iburst #server 0.cn.pool.ntp.org iburst server 127.127.1.0 fudge 127.127.1.0 stratum 10
启动 ntp
service ntpd start
查看 ntp 情况,可以看到在 offset 和 jitter 上是有对应的值的,在 remote
中有*开头的是ntp当前选中的授时服务点:
[root@mdw ~]# ntpq -p remote refid st t when poll reach delay offset jitter ============================================================================== -ntp2.itcomplian 5.103.128.88 3 u 6 64 1 351.985 39.559 1.853 +mail.python.org 131.188.3.221 2 u 5 64 1 200.830 -50.568 11.188 *li734-36.member 10.84.87.146 2 u 4 64 1 68.791 -43.469 1.006 +61-216-153-106. 211.22.103.158 3 u 3 64 1 60.575 -27.762 1.399 LOCAL(0) .LOCL. 10 l - 64 0 0.000 0.000 0.000
当然如果不配置 server x.cn.pool.ntp.org iburst
,查看 ntp 情况,是这样的,ntp直接选中的是 LOCAL:
[root@mdw ~]# ntpq -p remote refid st t when poll reach delay offset jitter ============================================================================== *LOCAL(0) .LOCL. 10 l 3 64 1 0.000 0.000 0.000
4. 配置被授节点
先使用 ntpdate 让 被授节点
更新时间:
[root@mdw ~]# ssh root@sdw01 'ntpdate mdw' root@sdw01's password: 24 May 17:25:32 ntpdate[20159]: step time server 10.20.17.140 offset 204.898966 sec [root@mdw ~]# ssh root@sdw02 'ntpdate mdw' root@sdw02's password: 24 May 17:26:12 ntpdate[20885]: adjust time server 10.20.17.140 offset 0.092156 sec [root@mdw ~]# ssh root@sdw03 'ntpdate mdw' root@sdw03's password: 24 May 17:26:24 ntpdate[20493]: step time server 10.20.17.140 offset 341.003116 sec [root@mdw ~]# ssh root@sdw04 'ntpdate mdw' root@sdw04's password: 24 May 17:26:37 ntpdate[20496]: adjust time server 10.20.17.140 offset 0.093937 sec [root@mdw ~]#
还是登入 mdw 节点,编辑原来的备份好的配置文件
nano /home/ntp.conf
#server 0.centos.pool.ntp.org iburst #server 1.centos.pool.ntp.org iburst #server 2.centos.pool.ntp.org iburst #server 3.centos.pool.ntp.org iburst server mdw iburst
把此配置文件传至其他被授节点
:
[root@mdw ~]# scp /home/ntp.conf root@sdw01:/etc/ntp.conf root@sdw01's password: ntp.conf 100% 2023 2.0KB/s 00:00 [root@mdw ~]# scp /home/ntp.conf root@sdw02:/etc/ntp.conf root@sdw02's password: ntp.conf 100% 2023 2.0KB/s 00:00 [root@mdw ~]# scp /home/ntp.conf root@sdw03:/etc/ntp.conf root@sdw03's password: ntp.conf 100% 2023 2.0KB/s 00:00 [root@mdw ~]# scp /home/ntp.conf root@sdw04:/etc/ntp.conf root@sdw04's password: ntp.conf 100% 2023 2.0KB/s 00:00 [root@mdw ~]#
启动被授节点
的ntp服务:
[root@mdw ~]# ssh root@sdw01 'service ntpd restart' root@sdw01's password: Redirecting to /bin/systemctl restart ntpd.service [root@mdw ~]# ssh root@sdw02 'service ntpd restart' root@sdw02's password: Redirecting to /bin/systemctl restart ntpd.service [root@mdw ~]# ssh root@sdw03 'service ntpd restart' root@sdw03's password: Redirecting to /bin/systemctl restart ntpd.service [root@mdw ~]# ssh root@sdw04 'service ntpd restart' root@sdw04's password: Redirecting to /bin/systemctl restart ntpd.service
启动被授节点
的ntp服务情况,看到 offset 和 jitter 中有值,则说明正常:
[root@mdw ~]# ssh root@sdw01 'ntpq -p' root@sdw01's password: remote refid st t when poll reach delay offset jitter ============================================================================== *mdw LOCAL(0) 11 u 15 64 3 0.256 0.105 0.190 [root@mdw ~]# ssh root@sdw02 'ntpq -p' root@sdw02's password: remote refid st t when poll reach delay offset jitter ============================================================================== *mdw LOCAL(0) 11 u 17 64 3 0.152 -27.998 7.016 [root@mdw ~]# ssh root@sdw03 'ntpq -p' root@sdw03's password: remote refid st t when poll reach delay offset jitter ============================================================================== *mdw LOCAL(0) 11 u 15 64 3 0.221 0.084 0.079 [root@mdw ~]# ssh root@sdw04 'ntpq -p' root@sdw04's password: remote refid st t when poll reach delay offset jitter ============================================================================== *mdw LOCAL(0) 11 u 15 64 3 0.239 -29.479 2.525 [root@mdw ~]#
将所有节点的 ntp 服务都设置成开机启动,这里先对本机(mdw)进行设置:
[root@mdw ~]# chkconfig ntpd on Note: Forwarding request to 'systemctl enable ntpd.service'. Created symlink from /etc/systemd/system/multi-user.target.wants/ntpd.service to /usr/lib/systemd/system/ntpd.service. [root@mdw ~]# ssh root@sdw01 'chkconfig ntpd on' root@sdw01's password: Note: Forwarding request to 'systemctl enable ntpd.service'. Created symlink from /etc/systemd/system/multi-user.target.wants/ntpd.service to /usr/lib/systemd/system/ntpd.service. [root@mdw ~]# ssh root@sdw02 'chkconfig ntpd on' root@sdw02's password: Note: Forwarding request to 'systemctl enable ntpd.service'. Created symlink from /etc/systemd/system/multi-user.target.wants/ntpd.service to /usr/lib/systemd/system/ntpd.service. [root@mdw ~]# ssh root@sdw03 'chkconfig ntpd on' root@sdw03's password: Note: Forwarding request to 'systemctl enable ntpd.service'. Created symlink from /etc/systemd/system/multi-user.target.wants/ntpd.service to /usr/lib/systemd/system/ntpd.service. [root@mdw ~]# ssh root@sdw04 'chkconfig ntpd on' root@sdw04's password: Note: Forwarding request to 'systemctl enable ntpd.service'. Created symlink from /etc/systemd/system/multi-user.target.wants/ntpd.service to /usr/lib/systemd/system/ntpd.service.
再次使用脚本查看集群时间,注意由于脚本执行有时差,所以会出现相差正负1秒的情况,此集群(10Mb/s的局域网)只有5台服务器,超过1秒就是不正常的了(注意:如果集群内服务器过多,此脚本出现误差会变大):
[root@mdw ~]# ./get_all_host_time.sh spawn ssh root@mdw date +%Y%m%d-%H%M%S root@mdw's password: 20170524-173747 spawn ssh root@sdw01 date +%Y%m%d-%H%M%S root@sdw01's password: 20170524-173747 spawn ssh root@sdw02 date +%Y%m%d-%H%M%S root@sdw02's password: 20170524-173748 spawn ssh root@sdw03 date +%Y%m%d-%H%M%S root@sdw03's password: 20170524-173748 spawn ssh root@sdw04 date +%Y%m%d-%H%M%S root@sdw04's password: 20170524-173748