Redis学习笔记(四)
Redis发布订阅
学习自狂神b站视频
简介
Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接受消息。
可用在微信,微博诸类有关注系统的程序中。
订阅/发布消息图:
示例:
- 一个频道被多个客户端订阅
- 发布者发布消息通过
PUBLISH
命令发送给频道channel1时,此消息就会被发送给给订阅它的三个客户端
基本命令
PSUBSCRIBE pattern [pattern ...]
:订阅一个或多个符合给定模式的频道PUBSUB subcommand [argument [argument ...]]
:查看订阅与发布系统状态。PUBLISH channel message
:将信息发送到指定的频道。PUNSUBSCRIBE [pattern [pattern ...]]
:退订所有给定模式的频道。SUBSCRIBE channel [channel ...]
:订阅给定的一个或多个频道的信息。UNSUBSCRIBE [channel [channel ...]]
:指退订给定的频道。
以上命令被广泛应用于构建即时通信应用,如网络聊天室(chatroom)和实时广播,实时提醒等。
测试
- 作为订阅者关注一个频道,关注后自动监听频道的状态
127.0.0.1:6377> SUBSCRIBE yeyu#关注频道
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "yeyu"
3) (integer) 1
# 接收消息
1) "message" #消息
2) "yeyu" #来自哪个频道
3) "yuese" # 消息内容
1) "message"
2) "yeyu"
3) "yeyu"
- 新增一个redis作为发布者发布消息
127.0.0.1:6377> PUBLISH yeyu "yuese" #给指定频道发布消息
(integer) 1
127.0.0.1:6377> publish yeyu "yeyu"
(integer) 1
原理
Redis是使用C实现的,通过分析Redis源码里的pubsub.c文件,了解发布和订阅机制的底层实现,籍此加深对Redis的理解。
Redis通过PUBLISH
、SUBSCRIBE
和PSUBSCRIB
E等命令实现发布和订阅功能。
-
通过
SUBSCRIBE
命令订阅某频道后,redis server
里维护了一个字典,字典的键就是一个个频道 , 而字典的值则是一个链表,链表中保存了所有订阅这个channel
的客户端。SUBSCRIBE
命令的关键.就是将客户端添加到给定channel
的订阅链表中。 -
通过
PUBLISH
命令向订阅者发送消息,redis server
会使用给定的频道作为键,在它所维护的channe
字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。 -
Pub/Sub
从字面上理解就是发布(Publish
)与订阅(Subscribe
) , 在Redis
中,你可以设定对某一个key
值进行消息发布及消息订阅,当一个key
值上进行了消息发布后,所有订阅它的客户端都会收到相应的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能
使用场景:
- 实时消息系统
- 实时聊天频道(聊天室)
- 订阅系统
- 关注系统
稍微复杂的场景我们就会使用MQ/kafka
Redis主从复制
简介
主从复制,读写分离!
在系统中,80%的时间都在读操作!
为了减缓服务器压力!将读的操作给从机,这点在架构中经常使用!最少一主二从
主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点 (master/leader
),后者称为从节点(slave/follower
);
数据的复制是单向的,只能由主节点到从节点。Master以写为主,Slave以读为主。
默认情况下,每台Redis服务器都是主节点;
且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
作用
- 数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
- 故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
- 负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
- 高可用(集群)基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的(宕机,一主二从)﹐原因如下:
- 从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大;
- 从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存,一般来说,单台Redis最大使用内存不应该超过20G.
环境配置
127.0.0.1:6379> info replication # 查看当前库的信息
# Replication
role:master # 角色
connected_slaves:0 # 从机数量
master_failover_state:no-failover
master_replid:1aa0f71da90b39d6d6d07ed7f539922bb4a75584
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
开启三台机器,复制三个配置文件 redis.conf,然后修改配置信息
- 端口
- 主机密码
- pid名
- log日志名字
- dump.db名字
修改完毕后我们可以启动三个进程
主从复制模式
1. 一主两从
默认情况下每台redis服务器都是主节点,只需配置从机就可
一主(79)二从(80,81)
在从机上输入如下命令确定主机
slaveof ip(默认127.0.0.1,阿里云是内网IP) 6379
- 主机(79)
127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:2
slave0:ip=127.0.0.1,port=6380,state=online,offset=196,lag=1
slave1:ip=127.0.0.1,port=6381,state=online,offset=196,lag=0
master_replid:c24d687ead4f9219cad468616cd8b0d524583f49
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:196
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:196
- 从机(80)
127.0.0.1:6380> slaveof 127.0.0.1 6379 #找谁当主机
OK
127.0.0.1:6380> info replication #查看当前库信息
# Replication
role:slave #当前角色
master_host:127.0.0.1 #主机地址
master_port:6379
master_link_status:up
master_last_io_seconds_ago:3
master_sync_in_progress:0
slave_repl_offset:14
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:c24d687ead4f9219cad468616cd8b0d524583f49
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:14
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:14
127.0.0.1:6380> role
1) "slave"
2) "172.25.3.87"
3) (integer) 6379
4) "connected"
5) (integer) 5908
- 从机(81)
127.0.0.1:6380> slaveof 127.0.0.1 6379 #找谁当主机
OK
127.0.0.1:6380> info replication #查看当前库信息
# Replication
role:slave #当前角色
master_host:127.0.0.1 #主机地址
master_port:6379
master_link_status:up
master_last_io_seconds_ago:3
master_sync_in_progress:0
slave_repl_offset:14
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:c24d687ead4f9219cad468616cd8b0d524583f49
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:14
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:14
注意:在真实的开发中主从配置应该在配置文件中配置,只有在配置文件中进行配置后才是永久的,而我们使用的是命令进行配置的,是临时的
细节
主机可以设置值,从机不能写只能读 ,主机里面写的值都会被从机保存下来
主机写:
从机只能读,不能写
注意:
- 如果主机宕机了,从机还会连接到主机,只不过没有写操作了,但是还可以照样读取。当主机回来后,正常写正常读。
- 但是如果主机关机重启,因为我们是命令设置的,一旦重新启动,从机就会变回主机,无法获取在宕机期间主机写的值。但是只要变成从机就可以里立马到主机的值。
- 如果从机宕机,只要没讲主机写入配置文件中,则再次重启后自动成为主机
- 如果将此主机再次变为从机,则立刻能从主机中读到值
此处涉及到复制原理
复制原理
Slave
启动成功连接到master后会发送一个sync
(同步命令)
Master接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,在后台进程执行完毕之后,master将传送整个数据文件到slave,并完成一次完全同步。
- 全量复制:而
slave
服务在接收到数据库文件数据后,将其存盘并加载到内存中。 - 增量复制:
Master
继续将新的所有收集到的修改命令依次传给slave,完成同步
但是只要是重新连接master,一次完全同步(全量复制)将被自动执行。我们的数据从机一定可以看到
2. 链路模式
此时的80依旧时从节点,只能读,不能写入
当79宕机后,我们需要手动选取一个主机出来、这时候我们可以使用
SlaveOf no one
命令将80从节点变成主节点,
127.0.0.1:6380> slaveof no one #没主机了,自己当主机
OK
127.0.0.1:6380> info replication #查看当前库信息
# Replication
role:msater #当前角色
connected_slaves:1
slave1:ip=127.0.0.1,port=6381,state=online,offset=196,lag=0
master_replid:c24d687ead4f9219cad468616cd8b0d524583f49
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:1073
second_repl_offset:1074
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:1073
这个时候其它从节点就可以使用
slaveof 127.0.0.1 6380
手动连接该主节点(哨兵模式自动)
如果此时原来的79主机重启回来了,主机依旧是80.已经谋朝篡位成功了,不可能再退位
注意:在工作中,以上两种模式一般不会被使用
哨兵模式(Sentinel )(面试高频)
哨兵自动巡查,当原有主机宕机后,自动选举新的主机出来
简介
主从切换技术的方法是︰当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel (哨兵)架构来解决这个问题。
哨兵模式可看作谋朝篡位的自动版,能够后台监控主机是否故障,如果出现故障,根据投票数自动将从库
转换为主库
。
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。
作用
哨兵作用:
- 哨兵进程通过发送命令,让
Redis
服务器响应以监控其运行状态,包括主服务器和从服务器 - 当哨兵监测到Redis主机宕机,会自动将
slave
切换成master
,然后通过发布订阅模式通知其他服务器,修改配置文件,让他们换主机
假设主服务器宕机,哨兵1先检测到结果,但是系统并不会马上进行
failover
(重新选举)过程,仅仅是哨兵1主观认为主服务器不可以用,这个现象称为主观下线,当后面的哨兵也检测到主服务器不可用,并且数量达到一定时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover
故障转移操作。
这里的投票涉及到一个算法,之后补上
操作转移成功后。就会发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这一过程称为 客观下线
测试
我们目前状态是一主二从
- 配置哨兵配置文件
sentinel.conf
:
# sentinel monitor 被监控名称 host port 票数
sentinel monitor myredis 172.17.0.1 6379 1
这个
1
,代表主机挂了,slave
投票看让谁接替成为主机,票数最多的就会成为主机
- 启动哨兵
redis-sentinel kconfig/sentinel.conf
3. 主机宕机,哨兵选举
此时哨兵开始监视,当断开主机后,自动选举一个从机成为主机
从机状态:成为主机
哨兵日志:检测79宕机,选举80为新主机
如果此时主机重启,只能归并到新的主机下当从机
优缺点
优点:
- 哨兵集群基于主从复制模式,所有的主从配置优点他全有
- 主从可以切换,故障可以转移,系统的可用性更好
- 哨兵模式就是主从模式的升级,手动到自动,更加的灵活
缺点:
- redis不好在线扩容,如果集群满了,在线扩容就十分麻烦
- 实现哨兵模式是很麻烦的,里面有很多选择如下
哨兵模式全部配置
# Example sentinel.conf
# 哨兵sentinel实例运行的端口 默认26379
port 26379
# 哨兵sentinel的工作目录
dir /tmp
# 哨兵sentinel监控的redis主节点的 ip port
# master-name 可以自己命名的主节点名字 只能由字母A-z、数字0-9 、这三个字符".-_"组成。
# quorum 配置多少个sentinel哨兵统一认为master主节点失联 那么这时客观上认为主节点失联了
# sentinel monitor <master-name> <ip> <redis-port> <quorum>
sentinel monitor mymaster 127.0.0.1 6379 2
# 当在Redis实例中开启了requirepass foobared 授权密码 这样所有连接Redis实例的客户端都要提供密码
# 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码
# sentinel auth-pass <master-name> <password>
sentinel auth-pass mymaster MySUPER--secret-0123passw0rd
# 指定多少毫秒之后 主节点没有应答哨兵sentinel 此时 哨兵主观上认为主节点下线 默认30秒
# sentinel down-after-milliseconds <master-name> <milliseconds>
sentinel down-after-milliseconds mymaster 30000
# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,这个数字越小,完成failover所需的时间就越长,但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。
# sentinel parallel-syncs <master-name> <numslaves>
sentinel parallel-syncs mymaster 1
# 故障转移的超时时间 failover-timeout 可以用在以下这些方面:
#1. 同一个sentinel对同一个master两次failover之间的间隔时间。
#2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
#3.当想要取消一个正在进行的failover所需要的时间。
#4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了
# 默认三分钟
# sentinel failover-timeout <master-name> <milliseconds>
sentinel failover-timeout mymaster 180000
# SCRIPTS EXECUTION
#配置当某一事件发生时所需要执行的脚本,可以通过脚本来通知管理员,例如当系统运行不正常时发邮件通知相关人员。
#对于脚本的运行结果有以下规则:
#若脚本执行后返回1,那么该脚本稍后将会被再次执行,重复次数目前默认为10
#若脚本执行后返回2,或者比2更高的一个返回值,脚本将不会重复执行。
#如果脚本在执行过程中由于收到系统中断信号被终止了,则同返回值为1时的行为相同。
#一个脚本的最大执行时间为60s,如果超过这个时间,脚本将会被一个SIGKILL信号终止,之后重新执行。
#通知型脚本:当sentinel有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等),将会去调用这个脚本,这时这个脚本应该通过邮件,SMS等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时,将传给脚本两个参数,一个是事件的类型,一个是事件的描述。如果sentinel.conf配置文件中配置了这个脚本路径,那么必须保证这个脚本存在于这个路径,并且是可执行的,否则sentinel无法正常启动成功。
#通知脚本
# shell编程
# sentinel notification-script <master-name> <script-path>
sentinel notification-script mymaster /var/redis/notify.sh
# 客户端重新配置主节点参数脚本
# 当一个master由于failover而发生改变时,这个脚本将会被调用,通知相关的客户端关于master地址已经发生改变的信息。
# 以下参数将会在调用脚本时传给脚本:
# <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port>
# 目前<state>总是“failover”,
# <role>是“leader”或者“observer”中的一个。
# 参数 from-ip, from-port, to-ip, to-port是用来和旧的master和新的master(即旧的slave)通信的
# 这个脚本应该是通用的,能被多次调用,不是针对性的。
# sentinel client-reconfig-script <master-name> <script-path>
sentinel client-reconfig-script mymaster /var/redis/reconfig.sh # 一般都是由运维来配置!