Redis简介以及多种数据数据结构
1. 是什么
- 开源免费的,用c语言编写的,遵守BSD协议
- 是一个高性能的(key/value)分布式内存数据库,基于内存运行并支持持久化的NoSQL数据库,是当前最热门的NoSQ数据库之一,也被人们称为数据结构服务器
2. 特点
- 支持数据持久化,将内存中的数据保存在磁盘中,重启时可以再次加载进行使用
- 不仅仅支持key-value类型的数据,同时还提供list、set、zset、hash等数据结构的存储
- 支持数据备份,即master-slave模式的数据备份
3. 能干嘛
- 内存储存和持久化:redis支持异步将内存中的数据写到硬盘上,同时不影响继续服务读取最新N个数据的操作,如:可以将最新的10条评论的ID放在Redis的List集合中
- 模拟类似与HttpSession这种需要设定过期时间的功能
- 发布、订阅消息系统
- 定时器、计数器
4. 下载(直接使用wget指令从官网获取)
5. Linux下安装
- 解压 tar -zxvf
- 运行make
- 提示需要安装c编译器 yum -install gcc-c++
- 再次运行make
- 提示没有Jemalloc/hemalloc:没有哪个目录
- 运行make distclean之后再make
7. 测试Redis
8. 基本知识
- 单线程
- select 数字库序号:选择数据库(一共有16个,配置文件中可以设置)
- dbsize:查看数据库大小keys * :罗列所有键
- FLUSHDB:清除缓存
- FLUSHALL:清除所有库缓存
- 默认端口:6379
- move key dbindex:移动当前库缓存到其他库
- exists key:判断key是否存在
- ttl key:查看缓存多久过期,-1表示永不过期,-2表示已过期
- type key:查看缓存类型
- expire key 秒钟:设置缓存活动时间
9. Redis数据类型
-
五大数据类型(具体的使用方法可以在这个网站查看:Redis命令手册)
- String:是安全的二进制。意思是redis的string可以包含任何数据。比如jpg图片或序列化对象
- Hash(单值多value):是一个键值对集合,特别适合用于存储对象。类似Java中的Map<String,Object>
- List(底层是链表实现)
- Set(单值多value):String类型的无序集合。它是通过HashTable实现的。
- Zset(sorted set:有序集合):每个元素都会关联一个double类型的分数,通过分数来从小到大排序。zset的成员是唯一的,分数可以重复
2. 核心配置文件(redis.conf):常用的30个配置参数如下
-
Redis默认不是以守护进程的方式运行,可以通过该配置项修改,使用yes启用守护进程
daemonize no -
当Redis以守护进程方式运行时,Redis默认会把pid写入/var/run/redis.pid文件,可以通过pidfile指定
pidfile /var/run/redis.pid -
指定Redis监听端口,默认端口为6379,作者在自己的一篇博文中解释了为什么选用6379作为默认端口,因为6379在手机按键上MERZ对应的号码,而MERZ取自意大利歌女Alessia Merz的名字
port 6379 -
绑定的主机地址
bind 127.0.0.1 -
当 客户端闲置多长时间后关闭连接,如果指定为0,表示关闭该功能
timeout 300 -
指定日志记录级别,Redis总共支持四个级别:debug、verbose、notice、warning,默认为verbose
loglevel verbose -
日志记录方式,默认为标准输出,如果配置Redis为守护进程方式运行,而这里又配置为日志记录方式为标准输出,则日志将会发送给/dev/null
logfile stdout -
设置数据库的数量,默认数据库为0,可以使用SELECT 命令在连接上指定数据库id
databases 16 -
指定在多长时间内,有多少次更新操作,就将数据同步到数据文件,可以多个条件配合
save
Redis默认配置文件中提供了三个条件:
save 900 1
save 300 10
save 60 10000
分别表示900秒(15分钟)内有1个更改,300秒(5分钟)内有10个更改以及60秒内有10000个更改。 -
指定存储至本地数据库时是否压缩数据,默认为yes,Redis采用LZF压缩,如果为了节省CPU时间,可以关闭该选项,但会导致数据库文件变的巨大
rdbcompression yes -
指定本地数据库文件名,默认值为dump.rdb
dbfilename dump.rdb -
指定本地数据库存放目录
dir ./ -
设置当本机为slav服务时,设置master服务的IP地址及端口,在Redis启动时,它会自动从master进行数据同步
slaveof -
当master服务设置了密码保护时,slav服务连接master的密码
masterauth -
设置Redis连接密码,如果配置了连接密码,客户端在连接Redis时需要通过AUTH 命令提供密码,默认关闭
requirepass foobared -
设置同一时间最大客户端连接数,默认无限制,Redis可以同时打开的客户端连接数为Redis进程可以打开的最大文件描述符数,如果设置 maxclients 0,表示不作限制。当客户端连接数到达限制时,Redis会关闭新的连接并向客户端返回max number of clients reached错误信息
maxclients 128 -
指定Redis最大内存限制,Redis在启动时会把数据加载到内存中,达到最大内存后,Redis会先尝试清除已到期或即将到期的Key,当此方法处理 后,仍然到达最大内存设置,将无法再进行写入操作,但仍然可以进行读取操作。Redis新的vm机制,会把Key存放内存,Value会存放在swap区
maxmemory -
指定是否在每次更新操作后进行日志记录,Redis在默认情况下是异步的把数据写入磁盘,如果不开启,可能会在断电时导致一段时间内的数据丢失。因为 redis本身同步数据文件是按上面save条件来同步的,所以有的数据会在一段时间内只存在于内存中。默认为no
appendonly no -
指定更新日志文件名,默认为appendonly.aof
appendfilename appendonly.aof -
指定更新日志条件,共有3个可选值:
no:表示等操作系统进行数据缓存同步到磁盘(快)
always:表示每次更新操作后手动调用fsync()将数据写到磁盘(慢,安全)
everysec:表示每秒同步一次(折衷,默认值)
appendfsync everysec -
指定是否启用虚拟内存机制,默认值为no,简单的介绍一下,VM机制将数据分页存放,由Redis将访问量较少的页即冷数据swap到磁盘上,访问多的页面由磁盘自动换出到内存中(在后面的文章我会仔细分析Redis的VM机制)
vm-enabled no -
虚拟内存文件路径,默认值为/tmp/redis.swap,不可多个Redis实例共享
vm-swap-file /tmp/redis.swap -
将所有大于vm-max-memory的数据存入虚拟内存,无论vm-max-memory设置多小,所有索引数据都是内存存储的(Redis的索引数据 就是keys),也就是说,当vm-max-memory设置为0的时候,其实是所有value都存在于磁盘。默认值为0
vm-max-memory 0 -
Redis swap文件分成了很多的page,一个对象可以保存在多个page上面,但一个page上不能被多个对象共享,vm-page-size是要根据存储的 数据大小来设定的,作者建议如果存储很多小对象,page大小最好设置为32或者64bytes;如果存储很大大对象,则可以使用更大的page,如果不 确定,就使用默认值
vm-page-size 32 -
设置swap文件中的page数量,由于页表(一种表示页面空闲或使用的bitmap)是在放在内存中的,,在磁盘上每8个pages将消耗1byte的内存。
vm-pages 134217728 -
设置访问swap文件的线程数,最好不要超过机器的核数,如果设置为0,那么所有对swap文件的操作都是串行的,可能会造成比较长时间的延迟。默认值为4
vm-max-threads 4 -
设置在向客户端应答时,是否把较小的包合并为一个包发送,默认为开启
glueoutputbuf yes -
指定在超过一定的数量或者最大的元素超过某一临界值时,采用一种特殊的哈希算法
hash-max-zipmap-entries 64
hash-max-zipmap-value 512 -
指定是否激活重置哈希,默认为开启(后面在介绍Redis的哈希算法时具体介绍)
activerehashing yes -
指定包含其它的配置文件,可以在同一主机上多个Redis实例之间使用同一份配置文件,而同时各个实例又拥有自己的特定配置文件
include /path/to/local.conf
4. 持久化(RDB、AOF)
1. RDB是什么
-
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。
-
fork:fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程
-
RDB保存的是dump.rdb文件
2. 基本配置信息
- redis.conf中的SNAPASHOTTING
- stop-writes-on-bgsave-error:当备份错误时停止写入数据
- rdbcompression yes:备份的快照是否进行压缩
- rdbchecksum yes:压缩完毕后使用crc64算法j进行数据校验
- dbfilename:备份文件名
- dir:目录
3. 如何触发
- 配置文件中设置
- 立刻触发:save(只备份不存)bgsave(存的同时备份)
4. 如何恢复
- 将备份文件移动到安装目录并启动服务即可(config get dir获取目录)
5. 优势与劣势
- 优势:适合大规模的数据恢复,对数据完整性和一致性要求不高
- 劣势:意外错误程序关闭的话会失去最后一次备份,fork的适合需要复制一份,需要考虑内存
1. AOF是什么
- 以日志的形式来记录每个写操作,将Redis执行过的所有写指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作
2. 保存的是appendonly.aof文件
- 配置信息在之前的30个配置信息中有介绍到
3. Rewrite
- 是什么:AOF采用文件追加方式,文件会越来越大为避免出现此种情况,新增了重写机制,当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集.可以使用命令bgrewritea
- 重写原理:AOF文件持续增长而过大时,会fork出一条新进程来将文件重写(也是先写临时文件最后再rename),遍历新进程的内存中数据,每条记录有一条的Set语句。重写aof文件的操作,并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似
- 触发机制:Redis会记录上次重写时的AOF大小,默认配置是当AOF文件大小是上次rewrite后大小的一倍且文件大于64M时触发(一般不会设置那么小)
4. 优势与劣势
- 优势:灵活配置,每秒同步或者每修改同步或者不同步
- 劣势:远文件大于rdb文件,效率慢于rdb
1. 使用的选择
- 如果同时开启两种:
在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,
因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整.
RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件。 - 那要不要只使用AOF呢?
建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),
快速重启,而且不会有AOF可能潜在的bug,留着作为一个万一的手段。
在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,
因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整.
5. Redis事物
1. 是什么
- 可以一次执行多个命令,本质是一组命令的集合。一个事务中的所有命令都会序列化,按顺序地串行化执行而不会被其它命令插入,不许加塞
3. 能干嘛
- 一个队列中,一次性、顺序性、排他性的执行一系列命令
4. 使 用
1. 相关指令
- DISCARD:取消事物
- EXEC:执行所有事物块内的命令
- MULTI:标记一个事物的开始
- UNWATCH:取消WATCH命令对所有key的监视
- WATCH:监视一个或多个key,如果在事物执行之前这个key被其他命令改动,事物将会中断
2. 多种执行情况
- 正常执行
- 一个错误,则整个事物不执行
- 如果编译通过,运行时报错,则只有报错的不执行
- watch监控:类似乐观锁
- 乐观锁:对整张表加锁,并发行极差,安全性好
- 悲观锁:行锁,在行后边加上version
6. 发布和订阅机制
是什么:进程间的一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息
命令
- PSUBSCRIBE c1 c2 c3:订阅三个频道
- PUBLISH c2 hello-redis:c2发送了hello-redis的消息
- PSUBSCRIBE new* :通配符订阅
7. Redis的复制(master、slave)
1. 是什么
- 行话:也就是我们所说的主从复制,主机数据更新后根据配置和策略,自动同步到备机的master/slaver机制,Master以写为主,Slave以读为主
3. 能干嘛
- 主要:读写分离、容灾恢复
4. 配置方式
-
配从(库)不配主(库)
-
从库配置:slaveof 主库ip 主库端口
- 每次断开后都得重新连接,除非配置redis.conf
-
修改配置文件细节操作
- 拷贝多个redis.conf文件
- 修改配置文件细节(端口)
-
常用三招
- 一主二仆:一个主机多个从机
- 薪火相传:
- 反客为主:slaveof on one。使当前数据库停止与其他数据库的同步,转成主数据库
-
复制原理
- 但是只要是重新连接master,一次完全同步(全量复制)将被自动执行
- 增量复制:Master继续将新的所有收集到的修改命令依次传给slave,完成同步
- 全量复制:而slave服务在接收到数据库文件数据后,将其存盘并加载到内存中。
- Master接到命令启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,
- 在后台进程执行完毕之后,master将传送整个数据文件到slave,以完成一次完全同步
- slave启动成功连接到master后会发送一个sync命令
6. 哨兵模式
是什么
- 反客为主的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库
配置哨兵
- 在/myredis目录下创建sentinel.conf
- 配置哨兵,填写内容
- sentinel monitor 被监控数据库名字 127.0.0.1 6379 1
- 数字1代表主机挂掉后salve投票看让谁接替成为主机,的票数夺得成为主机
- 启动哨兵
- Redis-sentinel/myredis/sentinel.conf
一组哨兵能监听多个主机