文章目录
NoSQL
概述
not only sql 泛指非关系型数据库
-
nosql特点
1.方便扩展(数据之间没有关系)
2.大数据量和高性能(redis一秒写8万次,读取11万,NoSql的缓存记录级,是一种细粒度的缓存,性能高)
3.数据类型多样(不需要事先设计数据库) -
大数据时代的3V和3高
- 3V:主要描述问题
1.海量Vulume
2.多样Variety
3.速率实时Velocity - 3高:对程序的要求
1.高并发
2.高可扩
3.高性能
- 3V:主要描述问题
分类
- KV键值对
- redis
- tair
- memecache
- 文档型数据库(bson格式和json一样)
- MongoDB
- 基于分布式文件存储的数据库,C++编写,主要用来处理大量的文档
- 非关系型数据库种功能最丰富的,最像关系型数据库的
- CouthDB
- MongoDB
- 列存储数据库
- HBase
- 分布式文件系统
- 图关系数据库
- 用来存储关系的
Redis(6379)
概述
remote dictionary server 远程字典服务(免费、开源)
内存存储、持久化(RDB,AOF)
- 特性
- 多样的数据类型
- 持久化
- 集群
- 事务
官网:https://redis.io/
注意:window版不建议使用(github下载,但是已经停更很久了)
安装
-
Windows
- 去github上下载,解压,运行
- 去官网,按照提示下载(类似在windows上的linux虚拟环境)
-
Linux
- 官网:https://redis.io/
注意:使用源安装后的默认安装路径:/usr/local/bin
- 官网:https://redis.io/
-
配置
daemonize yes为自动后台启动
redis-cli (-p 6379) 启动
shutdown关闭redis,再exit(直接用apt下载的无法关闭) -
测试性能
redis-benchmark 是一个官方的自带的压力测试工具
参数 | 描述 | 默认值 |
---|---|---|
-h | 指定服务器主机名 | 127.0.0.1 |
-p | 指定服务器端口 | 6379 |
-s | 指定服务器socket | |
-c | 指定并发连接数 | 50 |
-n | 指定连接数 | 10000 |
-d | 以字节的形式指定set/get值的数据大小 | 3 |
-k | 1=keep alive 0=reconnect | 1 |
-r | set/get/incr 使用随机key,SADD使用随机值 | |
-P | 通过管道传输请求 | 1 |
-q | 强制退出redis,仅显示query/sec值 | |
-csv | 以csv格式输出 | |
-l | 生成循环 | 永久执行测试 |
-t | 仅运行以逗号分隔的测试命令列表 | |
-I | idle模式,仅打开N个idle连接并等待 |
# 测试100个并发连接 100000请求
redis-benchmark -h localhost -p 6379 -c 100 -n 100000
基础知识
redis 默认16个数据库
默认使用的是第0个
使用select 进行切换
redis不区分大小写命令
select 3 # 切换数据库
DBSIZE # 查看数据库大小
flushdb # 清空当前数据库
flushall # 清空所有数据库
redis 6.0之后,采用了多个 I/O 线程来处理网络请求,但是对于命令的执行还是单线程的
Redis的5大数据类型
- redis-key
keys * # 获取当前数据库所有的key
set name sober # 插入数据
get name # 获取key为name的数据
exists name # 判断当前的key是否存在
move name 1 # 移除当前的key-value
expire name 10 # 设置key的过期时间,单位是秒(存在的key才能设置)
ttl name # 查看过期时间
type name # 查看数据类型
String(字符串)
append key1 "hello" #在value中追加字符串,如果当前key1不存在,相当于set key
strlen key1 # 获取字符串的长度
incr view # 自增1
decr view # 自减1
incrby view 10 # 设置步长为10 自增
decrby view 10 # 设置步长为10,自减
getrange key1 0 3 # 截取字符串[0,3]
getrange key1 0 -1 # 获取所有的字符串 == get key
setrange key1 1 xx # 替换指定位置开始的字符串
# setex(set with expire) 设置过期时间
# setnx (set if not exist) 不存在再设置(在分布式锁中会常常使用)
setex keys 30 "hello" # 设置keys的值为hello,30秒后过期
setnx mykey "redis" # 如果mykey不存在,创建mykey;如果存在,创建失败
mset k1 v1 k2 v2 k3 v3 # 同时设置多个值
mget k1 k2 k3 # 同时获取多个值
msetnx k1 v1 k4 v4 # msetnx是一个原子性的操作,要么一起成功,要么一起失败
# 这里的key是一个巧妙的设计: user:{id}:{field},
mset user:1:name sober user:1:age:25
mget user:1:name user:1:age
# getset 先get然后再set
getset db redis # 如果不存在,则返回nil,但是会存入db redis的key-value值
getset db mongodb # 如果存在值,获取原来的值,但是会设置为新的值
string类似的的使用场景,value除了是我们的字符串,还可以是我们的数字!
- 计数器
- 统计多单位的数量
- 粉丝数
- 对象缓存存储
List
list的命令需要在前面加L就行
LPUSH list one # 将一个值或者多个值,插入到列表头部(左)
Lrange list 0 -1 # 获取list中的值!
lrange list 0 1 # 通过区间获取具体的值!
rpush list righr # 将一个值或多个值,插入到列表的尾部(右)
Lpop list # 移除list的第一个元素
rpop list # 移除list的最后一个元素
lindex list 1 # 通过下标获取list中的某一个值
llen list # 获取list的长度
lrem list 1 one # 移除list列表中指定个数(1)的value(one),精确匹配
ltrim list 1 2 # 通过下标截取指定的长度,这个list剩下截取的元素
rpoplpush mylist otherlist # 移除列表的最后一个元素,将她移动到新的列表中
# lset将列表中指定下标的值替换为另一个值,更新操作
lset list 0 item # 如果不存在列表,就去更新的话会报错;如果存在,更新当前(0)下标的值
# linsert 将某个具体的value插入到列表中某个元素的前后或者后面
linsert mylist before field1 field2
linsert mylist after field1 field2
小结:
- 它实际是一个链表,before node after ,left,right都可以插入值
- 如果key不存在,创建新的链表
- 如果key存在,新增内容
- 如果移除了所有值,空链表,也代表不存在
- 在两边插入或者改动值,效率最高!中间元素,相对效率低
消息排队!消息队列(lpush rpop),栈(lpush Lpop)
Set(集合)
set中的value不重复
sadd myset "hello" # set集合中添加元素
smembers myset # 查看指定set的所有值
sismember myset hello # 判断某一个值是不是在set集合中
scard myset # 获取set集合中的元素个数
srem myset hello # 移除set集合中指定的元素
srandmember myset # 随机抽选出一个元素
srandmember myset 2 # 随机抽选出指定个数的元素
spop myset # 随机删除set集合中的元素
smove myset myset2 "kuangshen" # 将一个指定的值,移动到另外一个set集合中
sdiff key1 key2 # 差集
sinter key1 key2 # 交集 共同好友就可以这样实现
sunion key1 key2 # 并集
Hash(哈希)
map集合,key-map集合
hset myhash field1 sober # set一个具体 key-value
hget myhash field # 获取一个字段值
hmset myhash field1 hello field2 world # set多个key-value
hmget myhash field1 field2 # 获取多个字段值
hgetall myhash # 获取全部的数据
hdel myhash field1 # 删除hash指定key字段!对应的value值也就消失了
hlen myhash # 获取hash表的字段数量
hexists myhash fields # 判断hash中指定字段是否存在
hkeys myhash # 只获得所有field
hvals myhash # 只获得所有value
hincrby myhash fields 1 # 自增1
hincrby myhash fields -1 # 自减1
hsetnx myhash fields4 hello # 如果不存在则可以设置;如果存在则不能设置
hash适合对象的存储,string适合字符串的存储。
Zset(有序集合)
在set的基础上,增加了一个值,set k1 v1 ,zset k1 score1 v1
zadd myset 1 one # 添加一个值
zadd myset 2 two 3 thress # 添加多个值
zrangebyscore salary -inf +inf # 显示全部的用户 从小到大
zrevrange salary 0 -1 # 从大到小进行排序
zrangebyscore salary -inf +inf withscore #显示全部的用户并且附带成绩
zrangebyscore salary -inf 2500 withscore # 显示工资小于2500员工的升序排序
zrem salary xiaohong # 移除有序集合中的指定元素
zcard salary # 获取有序集合中的个数
zcount myset 1 3 获取指定区间的数量
三种特殊的数量类型
geospatial
# geoadd 添加地理位置
# 规则:两级无法直接添加,添加正确的经纬度
geoadd china:city 116.40 39.90 beijing
geoops china:city beijing chongqin # 获取指定的程序的经度和纬度
geodist china:city beijing shanghai km # 查看北京到上海的直线距离km
# georadius 以给定的经纬度为中心,找出某一半径内的元素
# 前提:所有的城市数据都录入到china:city
georadius china:city 110 30 1000 km # 以110,30这个经纬度为中心,寻找方圆1000km以内的城市
georadius china:city 110 30 500 km withdist # 显示到中间距离的位置
georadius china:city 110 30 500 km withcoord # 显示他人的定位信息
georadius china:city 110 30 500 km withcoord count 1 # 筛选出指定的结果
georadiusbymember china:city beijing 1000 km # 找出位于指定元素周围的其他元素
geohash china:city beijing # 将二维的经纬度转换为一维的字符串,如果两个字符串越接近,那么则距离越近!
geo底层的实现原理其实就是Zset!我们可以使用Zset命令来操作geo:
zrange china:city 0 -1 # 查看地图中全部元素
zrem china:city beijing # 移除指定元素
Hyperloglog
基数:不重复的元素个数
优点:占用的内存是固定的,2^64不同的元素的技术,只需要废12kb内存!如果要从内存角度来比较的话hyperloglog首选!(比set好,set占用内存大)
缺点:0.81%的错误率,但是可以忽略不计!
PFadd mykey z x c v b # 创建第一组元素
pfcount mykey # 统计mykey元素的基数
pfmerge mykey3 mykey mykey2 # 合并mykey mykey2 => mykey3并集
pfcount mykey3 # 查看并集的数量
如果允许容错,可以使用hyperloglog!(不允许就用set)
bitmaps
位存储
统计用户信息,活跃,不活跃!登录、未登录!打卡,365打卡!两个状态的,都可以使用bitmaps!
bitmap位图,数据结构!都是操作二进制来进行记录的,就有0和1两个状态。
setbit sign 0 1 #写入
setbit sign 1 0
getbit sign 0 # 查看
bitcount sign # 统计这周的打卡记录,
事务
redis事务本质:一组命令的集合!一个事务中的所有命令都会被序列化,在事务执行过程中,会按照顺序执行!
一次性、顺序性、排他性
redis事务没有隔离级别的概念
所有的命令在事务中,并没有直接被执行!只有发起执行命令的时候才会执行!Exec
redis单条命令保存原子性,但是事务不保证原子性
redis的事务:
- 开启事务(multi)
- 命令入队(…)
- 执行事务(exec)
multi # 开始事务
exec # 执行事务
discard # 取消事务 (事务队列中命令都不会被执行)
编译型异常:代码有问题!命令有错!事务中所有的命令都不会被执行!
运行时异常(1/0):如果事务队列中存在语法性错误,那么执行命令的时候,其他命令是可以正常执行的,错误命令抛出异常。
redis实现乐观锁
悲观锁:很悲观,认为什么时候都会出问题,无论做什么都会加锁
乐观锁:认为什么时候都不会出问题,所以不会上锁!更新数据的时候去判断,在此期间是否有人修改过这个数据。(获取version,修改的时候比较version)
# 使用watch可以当做redis的乐观锁操作
watch key1 # 监视money
multi
decrby key1 10
incrby key2 10
exec # 执行之前,如果存在另外一个线程,修改了我们的值,这个时候,就会导致事务执行失败;
unwatch # 解锁监视(如果事务执行失败,先解锁,再加锁watch key1)
redis.conf详解
-
配置文件 unit单位对大小写不敏感
-
网络
bind 127.0.0.1 # 绑定的ip
protected-mode yes # 保护模式
port 6379 # 端口设置
- 通用general
daemonize yes # 以守护进程的方式运行,默认是no,我们需要自己开启yes
pidfile /var/run/redis_6379.pid #如果以后台的方式运行,我们就需要指定一个pid文件
loglevel notice # 日志级别
logfile “” # 日志的文件位置名
databases 16 # 数据库的数量,默认是16个数据库
always-show-logo yes # 是否总是显示logo
- 快照
持久化,在规定的时间内,执行了多少次操作,则会持久化到文件.rdb .aof
redis是内存数据库,如果没有持久化,那么数据断电及失!
save 900 1 # 900s内,如果至少有1 key进行了修改,及进行持久化操作
save 300 10 # 300s内,如果至少10 key进行了修改,及进行持久化操作
stop-write-on-bgsave-error yes # 持久化如果出错,是否还需要继续工作
rdbcompression yes # 是否压缩rdb文件,需要消耗一些cpu资源
rdbchecksum yes # 保存rdb文件的时候,进行错误的检查校验
dir ./ # rdb文件保存的目录
-
replication复制
负责主从复制 -
security安全
可以在这里设置redis的密码,默认是没有密码的
config get requirepass # 获取redis的密码
config set requirepass "123456" # 设置redis的密码
auth 123456 # 使用密码进行登录
- 限制clients
maxclients 1000 # 设置能连接上redis的最大客户端的数量
maxmemory <bytes> # redis配置最大的内存容量
maxmemory-policy noeviction # 内存到达上限之后的处理策略
1.volatile-lru : 只设置了过期时间的key进行LRU(默认值)
2.allkeys-lru: 删除lru算法的key
3.volatile-random: 随机删除即将过期key
4.allkeys-random:随机删除
5.volatile-ttl: 删除即将过期的
6.noeviction: 永不过期,返回错误
- append only 模式 aof配置
appendonly no # 默认是不开启aof模式的,默认是使用rdb方式持久化,在发部分所有的情况下,rdb完全够用
appendfilename "appendonly.aof" # 持久化的文件的名字
# appendfsync always 每次修改都会sync,消耗性能
# appendsync everysec 每秒执行一次sync,可能会丢失这个ls的数据
# appendfsync no 不执行sync,这个时候操作系统自己同步数据,速度最快
redis持久化
redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失,所以redis提供了持久化功能。
RDB(Redis Database)
在主从复制中,rdb就是备用的 从机上。
-
触发机制
- save的规则满足的情况下,会自动触发rdb
- 执行flushall命令,也会触发rdb规则
- 退出redis,也会产生rdb文件
备份就自动生成一个dump.rdb文件
-
恢复rdb文件
- 1.只需要将rdb文件放在我们redis启动目录就可以,redis启动的时候会自动检查dump.rdb恢复其中的数据
- 2.查看需要存在的位置
config get dir
(/usr/local/bin) # 如果在这个目录下存在dump.rdb文件,启动就会自动恢复其中的数据
-
优缺点
- 优点:
1.适合大数据的数据恢复
2.对数据的完整性要求不高 - 缺点:
1.需要一定的时间间隔进行操作,如果redis意外宕机了,最后一次修改数据就没有了
2.fork进程的时候,会占用一定的空间
- 优点:
AOF(Append Only File)
将所有的命令都记录下来,history,恢复的时候就会把这个文件全部执行一遍。(文件的无限追加)
默认不开启,需要手动设置:appendonly yes;重启redis 生效。
如果aof文件有错误,redis无法启动,redis给我们提供了工具redis-check-aof --fix进行修复。
- 优点
1.每一次修改都同步,文件的完整会更加好
2.每秒同步一次,可能会丢失一秒的数据
3.从不同步AOF,效率最高 - 缺点
1.相对于数据文件来说,aof远远大于rdb,修复的速度也比rdb慢
2.aof运行效率也要比rdb慢,所以我们redis默认的配置就是rdb持久化。
扩展
1.rdb持久化方式能够在指定的时间间隔内你的数据进行快照存储
2.aof持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,aof命令以redis协议追加保存每次写的操作到文件末尾,redis还能对aof文件进行后台重写,使得aof文件的体积不至于过大。
3.只做缓存,如果你只希望你的数据在服务器运行的时候存在,你可以不做任何持久化
4.同时开启两种持久化方式
- 在这种情况下,当redis重启的时候会优先载入aof文件来恢复原始的数据,因为在通常情况下aof文件保存的数据集要比rdb文件保存的数据集要完整
- rdb的数据不实时,同时使用两者时服务器重启也只会找aof文件。但是rdb更适合用于备份数据库(aof在不断变化不好备份),快速重启,不会有aof存在的潜在bug。
5.性能建议:
- 因为RDB文件只用作后别备用途,建议只在slave上持久化rdb文件,而且只要15分钟备份一次,只保留save 900 1
- 如果enable aof,好处是在最恶劣情况下也会丢失不超过两秒数据,启动脚本简单只load自己的aof文件就可以了,代价一是带来了持续的IO,二是AOF rewrite的最后将rewrite过程中产生的新数据写到了新文件造成的阻塞几乎不可避免。只要硬盘许可,应该尽量减少AOF rewrite的频率,aof重写的基础大小默认值64m太小了,可以设到5g以上,默认超过原100%大小重写可以改到适当的数值。
- 如果不enable aof,仅靠master-salve replication 实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价是如果master/slave同时宕机,会丢失10几分钟的数据,启动脚本也要比较两个master/salve中的RDB文件,载入较新的那个。
redis发布订阅
redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送信息,订阅者(sub)接收信息。
subscribe sober # 订阅一个sober的频道
publish sober “hello” # 发布者发布hello到指定的sober频道
redis主从复制
主从复制,是将一台redis服务器的数据,复制到其他的redis服务器。前者成为主节点(master/leader),后者称为从节点(slave/follower);数据的复制是单向的,只能由主节点到从节点。master以写为主,slave以读为主。
默认情况下,每台redis服务器都是主节点;且一个主节点可以有多个从节点。
主从复制作用
1.数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式
2.故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余
3.负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读写服务,分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高redis服务器的并发量
4.高可用(集群)基石:主从复制是哨兵和集群的基础。
一般来说,都会使用多台redis的服务器(避免宕机带来的影响):
1.从结构上,单个redis服务器会发生单点故障,请求负载大
2.从容量上,单个redis服务器内容容量有限,单台redis最大使用内存不应该超过20g
主从环境配置
只配置从库,不用配置主库
info replication # 查看当前库的信息
复制3个配置文件,然后修改对应的信息,生成从机
1.端口(port)
2.pid文件(pidfile)
3.log文件名字(logfile)
4.dump.rdb名字
5.使用redis-server [配置文件名] 启动
6.使用redis-cli -p 端口号连接
7.slaveof 127.0.0.1 6379 # 配置他的主机ip和端口
8.info replication # 查看从机配置
这样的配置是临时的,需要永久生效需要去修改从机对应的配置文件信息
从机只能读,不能写
主从复制原理
slave启动成功连接到master后会发送一个sync同步命令
master接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,在后台进程执行完毕之后,master将传送整个文件到slave,并完成一个完全同步。
全量复制
:而slave服务在接收到数据库文件数据后,将其存盘加载到内存中
增量复制
:master继续将新的所有收集到的修改命令依次传给slave,完成同步。
但是只要是重新连接master,一次完全同步(全量复制)将被自动执行,我们的数据一定可以在从机中看到。
变为主机
如果主机断开了连接,可以使用 slaveof no one
让自己变成主机,其他的节点就可以手动连接到这个最新的主节点(手动)
哨兵模式
主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费时费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。redis从2.8开始正式提供了sentinel架构来解决这个问题。
自动监控主机是否故障,如果故障了根据投票数自动将从库转换为主库。
哨兵模式是一种特殊的模式,首先redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待redis服务器响应,从而监控运行的多个redis实例。
假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观认为主服务器不可用,这个现象是主观下线。当一定数量的哨兵检测到这个服务器下线了,就会进行failover[故障转移]操作。就会通过发布订阅模式,让各个哨兵把自己监控的从服务器投票切换成主机,这个过程是客观下线。
简单配置哨兵配置文件
1.配置
#sentinel monitor 被监控的名称 host port 1
sentinel monitor myredis 127.0.0.1 6379 1
后面的数字1,代表主机挂了,slave投票让谁接替成为主机。(随机)
2.启动哨兵
redis-sentinel mysentinel.conf
如果主机此时回来,只能归并到新的主机下,当做从机,这就是哨兵模式的规则。
优缺点
-
优点
1.哨兵集群,基于主从复制模式,所有的主从配置优点,都有
2.主从可以切换,故障可以转移,系统的可用性高
3.哨兵模式是主从模式的升级,手动到自动,更加健壮。 -
缺点:
1.redis不好在线扩容,集群容量一旦到达上限,在线扩容就十分麻烦
2.实现哨兵模式的配置其实很麻烦,里面有很多选择。
详细的配置
# example sentinel.conf
# 哨兵sentinel实例运行的端口 默认是26739(如果有哨兵集群,每个哨兵都需要配置端口)
port 26739
# 哨兵sentinel的工作目录
dir /tmp
# 哨兵sentinel监控的redis主节点的 ip port
# master-name 可以自己命名的主节点名字,只能由字母A-z、数字0-9、这三个字符".-_"组成
# quorum配置多少个sentinel哨兵同一认为master主节点失联,那么这时客观上认为主节点失联了。
# sentinel monitor <master-name> <ip> <redis-port> <quorum>
sentinel monitor mymaster 127.0.0.1 6379 2
# 当在redis实例中开启了requirepass foobared 授权密码 这样所有连接redis实例的客户端都要提供密码
# 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码
# sentinel auth-pass <master-name> <password>
sentinel auth-pass mymaster mysuper--secret-123456
# 指定多少毫秒之后 主节点没有应答sentinel 此时 哨兵主观上认为主节点下线 默认30秒
# sentinel down-after-milliseconds <master-name> <milliseconds>
sentinel down-after-milliseconds mymaster 30000
# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行同步,这个数子越小,完成failover所需的时间就越长,
但是如果这个数字越大,就意味着越多的slave 因为replication而不可用。
可以通过将这个值设为1 来保证每次只有一个salve处于不能处理命令请求的状态
# sentinel parallel-syncs <master-name> <numslaves>
sentinel parallel-syncs mymaster 1
# 故障转移的超市时间failover-timeout可以用在以下几个方面:
# 1.同一个sentinel对同一个master两次failover之间的间隔时间。
# 2.当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
# 3.当想要取消一个正在进行的failover所需要的时间
# 4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来
# 默认3分钟
# sentinel failover timeout <master-name> <milliseconds>
sentinel failover timeout mymaster 180000
# SCRIPTS EXECUTION
# 通知型脚本:当sentinel有任何警告级别的事件发生时(比如说redis实例的主观和客观失效等等),将会去调用这个脚本,这时这个脚本应该通过邮件,sms等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时,将传给脚本两个参数,一个是事件的类型,一个是事件的描述。如果sentinel.conf配置文件中配置了这个脚本路径,那么必须保证这个脚本存在于这个路径,并且是可执行的,否则sentinel无法正常启动成功。
# 通知脚本
# shell编程
# sentinel notification-script <master-name> <script-path>
sentinel notification-script mymaster /var/redis/notify.sh
# 客户端重新配置主节点参数脚本
# 当一个master由于failover而发生改变时,这个脚本将会被调用,通知相关的客户端关于master地址已经发生了改变的信息。
# 以下参数将会在调用脚本时传给脚本:
# <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port>
# 目前<state>总是“failover”
# <role> 是“leader” 或者“observer”中的一个
# 参数from-IP,from-port,to-ip,to-port是用来和旧的master和新的master(即旧的slave)通信的
# 这个脚本应该是通用的,能被多次调用的,不是针对性的
# sentinel client-reconfig-script <master-name> <script-path>
sentinel client-reconfig-script mymaser /var/redis/reconfig.sh
redis缓存穿透,缓存击穿、和缓存雪崩
redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面。但同时,它也带来了一些问题。其中,最要害的,就是数据的一致性问题,从严格意义上讲,这个问题无解。如果对数据的一致性要求很高,那么就不能使用缓存。
缓存穿透(查不到)
缓存穿透的概念很简单,用户想要查询一个数据,发送redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,也是本次查询失败。当用户很多的时候,缓存都没有名字(秒杀),于是都去请求了持久数据库。这会给数据库造成很大的压力,这时候就相当于出现了缓存穿透。
- 布隆过滤器
布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力。
- 缓存空对象
当存储层不命中后,即使返回的空对象也将其缓存起来,同时设置一个过期时间,之后再访问这个数据会从缓存中获取,保护了后端数据源。
但是有两个问题:
1.如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为可能会有很多的空键
2.即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致。
缓存击穿(量太大,缓存过期)
当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且写入缓存,会导致数据库瞬间压力过大。
- 设置热点数据永不过期
从缓存层面来看,没有设置过期时间,所以不会出现热点key过期后产生的问题 - 加互斥锁
使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。
缓存雪崩
缓存雪崩,指在某一个时间段,缓存集中过期失效。
产生雪崩的原因之一,缓存在同一时间都过期了(或redis宕机),但是对于这批缓存的访问,还是很多,所以压力都落到了数据库上,就会产生周期性的压力波峰。
- redis高可用
redis搭建集群 - 限流降级
在缓存失效后,通过加锁或队列来控制读数据库写缓存的数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。 - 数据预热
数据加热的含义就是在正式部署之前,先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。