linux之redis简介、安装启动 、五种基本类型用法及应用场景、持久化
简介
Remote Dictionary Server(Redis) 远程字典服务器是完全开源免费的,用C语言编写的,遵守BSD开源协议,是一个高性能的(key/value)分布式内存数据库,基于内存运行,并支持持久化的NoSQL数据库,它也通常被称为数据结构服务器,因为值(value)可以是 字符串(String), 哈希(Map), 列表(list), 集合(sets) 和 有序集合(sorted sets)等类型
与传统数据库不同的是 Redis 的数据是存在内存中的,所以存写速度非常快,因此 Redis 被广泛应用于缓存方向。Redis为分布式缓存,在多实例的情况下,各实例共用一份缓存数据,缓存具有一致性
redis的优缺点
redis的优点
- 性能高,速度快
(1) 因为数据存在内存中,类似于 HashMap ,HashMap 的优势就是查找和操作的时间复杂度都是O (1) 。
(2) Redis 本质上是一个 Key-Value 类型的内存数据库,很像Memcached
,整个数据库统统加载在内存当中进行操作,定期通过异步操作把数据库数据 flush 到硬盘上进行保存。fork子进程持久化。
(3)因为是纯内存操作,Redis 的性能非常出色,每秒可以处理超过 10 万次读写操作,是已知性能最快的 Key-Value 数据库。
- 支持丰富数据类型: String ,List,Set,Sorted Set,Hash 。
Redis 的出色之处不仅仅是性能,Redis 最大的魅力是支持保存多种数据结构,此外单个 Value 的最大限制是1GB,不像Memcached只能保存1MB的数据,因此Redis可以用来实现很多有用的功能
- 丰富的特性
订阅发布 Pub / Sub 功能
Key 过期策略
事务
支持多个 DB 计数
- 持久化存储
Redis 提供 RDB 和 AOF 两种数据的持久化存储方案,解决内存数据库最担心的万一 Redis 挂掉,数据会消失掉。
redis的缺点
1、由于 Redis 是内存数据库,所以,单台机器,存储的数据量,跟机器本身的内存大小。虽然 Redis 本身有 Key过期策略,但是还是需要提前预估和节约内存。如果内存增长过快,需要定期删除数据。
2、redis是单线程的,单台服务器无法充分利用多核服务器的CPU
安装
下载地址:http://redis.io/download,下载最新稳定版本
wget http://download.redis.io/releases/redis-5.0.8.tar.gz
tar xzf redis-5.0.8.tar.gz
cd redis-5.0.8
make
启动
通过启动参数告诉redis使用指定配置文件使用下面命令启动。
cd src
./redis-server ../redis.conf
Redis 默认不是以守护进程的方式运行,可以修改redis.conf中的daemonize配置项,使用 yes 启用守护进程
启动redis服务进程后,就可以使用测试客户端程序redis-cli和redis服务交互了
cd src
./redis-cli
配置
Redis 的配置文件位于 Redis 安装目录下,文件名为 redis.conf
获取所有的配置
config get *
获取单个配置
config get daemonize
redis 键(key)
设置指定 key 的值
set name ‘bob’
获取指定 key 的值
get name
检查给定 key 是否存在
exists name
在 key 存在时删除 key。
del name
为给定 key 设置过期时间,以秒计。
expire name 300
EXPIREAT 的作用和 EXPIRE 类似,都用于为 key 设置过期时间。 不同在于 EXPIREAT 命令接受的时间参数是 UNIX
时间戳(unix timestamp)。
expireat name 1587733877
以秒为单位,返回给定 key 的剩余生存时间(TTL, time to live)。
ttl name
移除 key 的过期时间,key 将持久保持。
persist name
返回 key 所储存的值的类型。
type name
序列化给定 key ,并返回被序列化的值。
dump key
反序列化给定的序列化值,并将它和给定的 key 关联。
restore key ttl serialized-value
如:restore class_fan 0 “\x00\x06class2\x06\x00\xb2e\xe7\x82\xac\x19\xf2\xf9”
解释:
将序列化值"\x00\x06class2\x06\x00\xb2e\xe7\x82\xac\x19\xf2\xf9"反序列化并赋值为key class_fan
RESTORE 在执行反序列化之前会先对序列化值的 RDB 版本和数据校验和进行检查,如果 RDB 版本不相同或者数据不完整的话,那么 RESTORE 会拒绝进行反序列化,并返回一个错误。
参数 ttl 以秒为单位为 key 设置生存时间;如果 ttl 为 0 ,那么不设置生存时间。
家有巨贵,以狗会友,有意者加我微信哦!!!
redis的数据类型
String(字符串)
string简介
string 是 redis 最基本的类型,你可以理解成与 Memcached 一模一样的类型,一个 key 对应一个 value。
string 类型是二进制安全的。意思是 redis 的 string 可以包含任何数据。比如jpg图片或者序列化的对象。
string 类型是 Redis 最基本的数据类型,string 类型的值最大能存储 512MB。
string用法
设置指定 key 的值
set key value
获取指定 key 的值。
get key
返回 key 中字符串值的子字符(从0开始,包含结尾)
getrange key start end
将给定 key 的值设为 value ,并返回 key 的旧值(old value)。
getset key value
同时设置一个或多个 key-value 对。
mset key value [key1 value1…]
获取所有(一个或多个)给定 key 的值。
mget key value [key1 value1…]
返回 key 所储存的字符串值的长度。
strlen key
将值 value 关联到 key ,并将 key 的过期时间设为 seconds (以秒为单位)。
setex key seconds value
应用场景1: 设置验证码以及其过期时间
应用场景2 限制api在某一时段的访问次数
只有在 key 不存在时设置 key 的值。
setnx key value
应用场景: 防止重复提交
将 key 中储存的数字值增一。
incr key
应用场景1: 统计网站的访问次数
应用场景2: 每天注册用户数
将 key 所储存的值加上给定的增量值(increment) 。
incrby key increment
例如:set int1 1
incrby int1 2 自增2
将 key 中储存的数字值减一。
decr int1
key 所储存的值减去给定的减量值(decrement) 。
decrby int1 2
对 key 所储存的字符串值,设置或清除指定偏移量上的位(bit)。
setbit key offset value
例如:setbit bit1 0 1
setbit bit1 1 1
setbit bit1 2 1
对 key 所储存的字符串值,获取指定偏移量上的位(bit)。
getbit key offset
计算给定字符串中,被设置为1的比特位的数量
一般情况下,给定的整个字符串都会被进行计数,通过额外的start或end参数,可以让计数只在特定的位上进行
bitcount key [start][end]
对一个或多个保存二进制位的字符串key进行位元操作,并将结果保存在destkey上
bitop operation destkey key [key…]
operation:可以是and、or、not、xor这四种操作中的任意一种
返回字符串里面第一个被设置为1或者0的bit位置
bitpos key bit [start][end]
应用场景1: 统计用户签到
应用场景2: 统计活跃用户
Hash(哈希)
hash简介
Redis hash 是一个 string 类型的 field 和 value 的映射表,hash 特别适合用于存储对象。
Redis 中每个 hash 可以存储 232 - 1 键值对(40多亿)。
hash应用场景
应用场景1:会员信息
应用场景2:购物车列表
hash用法
将哈希表 key 中的字段 field 的值设为 value 。
hset key field value
只有在字段 field 不存在时,设置哈希表字段的值。
msetnx key field value
同时将多个 field-value (域-值)对设置到哈希表 key 中。
hmset key field value [field1 value…]
获取存储在哈希表中指定字段的值。
hget key field value
获取所有给定字段的值
hmget key field [field1 field2…]
为哈希表 key 中的指定字段的整数值加上增量 increment 。
hincrby key field increment
获取在哈希表中指定 key 的所有字段和值
hgetall key
获取所有哈希表中的字段
hkeys key
获取哈希表中所有值
hvals key
获取哈希表中字段的数量
hlen key
查看哈希表 key 中,指定的字段是否存在。
hexists key field
删除一个或多个哈希表字段
hdel key field1 [field2]
List(列表)
list简介
Redis列表是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)
一个列表最多可以包含 232 - 1 个元素 (4294967295, 每个列表超过40亿个元素)。
应用场景
应用场景1:粉丝列表
list应用
将一个或多个值插入到列表头部
lpush key value [value1…]
将一个值插入到已存在的列表头部
lpushx key value
在列表的元素前或者后插入元素
linsert key BEFORE|AFTER pivot value
通过索引设置列表元素的值
lset key index value
通过索引获取列表中的元素
lindex key index
获取列表指定范围内的元素
lrange key start end
获取列表长度
llen key
移出并获取列表的第一个元素
lpop key
移除列表元素
lrem key count value
对一个列表进行修剪(trim),就是说,让列表只保留指定区间内的元素,不在指定区间之内的元素都将被删除。
ltrim key start stop
集合(Set)
Set简介
Redis 的 Set 是 String 类型的无序集合。集合成员是唯一的,这就意味着集合中不能出现重复的数据。
Redis 中集合是通过哈希表实现的,所以添加,删除,查找的复杂度都是 O(1)。
集合中最大的成员数为 232 - 1 (4294967295, 每个集合可存储40多亿个成员)。
Set应用场景
应用场景1:共同好友
应用场景2:好友推荐
Set应用
向集合添加一个或多个成员
sadd key member1 [member2]
获取集合的成员数
scard key
返回集合中的所有成员
smembers key
判断 member 元素是否是集合 key 的成员
sismember key member
返回集合中一个或多个随机数
srandmember key [count]
返回给定所有集合的差集
sdiff key1 [key2]
返回给定所有集合的差集并存储在 destination 中
sdiffstore destination key1 [key2]
返回所有给定集合的并集
sunion key1 [key2]
所有给定集合的并集存储在 destination 集合中
sunionstore destination key1 [key2]
返回给定所有集合的交集
sinter key1 [key2]
返回给定所有集合的交集并存储在 destination 中
sinterstore destination key1 [key2]
移除并返回集合中的一个随机元素
spop key
移除集合中一个或多个成员
srem key member1 [member2]
将 member 元素从 source 集合移动到 destination 集合
smove source destination member
redis的持久化
redis的持久化流程
既然redis的数据可以保存在磁盘上,那么这个流程是什么样的呢?
要有下面五个过程:
(1)客户端向服务端发送写操作(数据在客户端的内存中)。
(2)数据库服务端接收到写请求的数据(数据在服务端的内存中)。
(3)服务端调用write这个系统调用,将数据往磁盘上写(数据在系统内存的缓冲区中)。
(4)操作系统将缓冲区中的数据转移到磁盘控制器上(数据在磁盘缓存中)。
(5)磁盘控制器将数据写到磁盘的物理介质中(数据真正落到磁盘上)。
这5个过程是在理想条件下一个正常的保存流程,但是在大多数情况下,我们的机器等等都会有各种各样的故障,这里划分了两种情况:
(1)Redis数据库发生故障,只要在上面的第三步执行完毕,那么就可以持久化保存,剩下的两步由操作系统替我们完成。
(2)操作系统发生故障,必须上面5步都完成才可以。
在这里只考虑了保存的过程可能发生的故障,其实保存的数据也有可能发生损坏,需要一定的恢复机制,不过在这里就不再延伸了。现在主要考虑的是redis如何来实现上面5个保存磁盘的步骤。它提供了两种策略机制,也就是RDB和AOF。
RDB机制
RDB其实就是把数据以快照的形式保存在磁盘上。什么是快照呢,你可以理解成把当前时刻的数据拍成一张照片保存下来。
RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘。也是默认的持久化方式,这种方式是就是将内存中数据以快照的方式写入到二进制文件中,默认的文件名为dump.rdb。
在我们安装了redis之后,所有的配置都是在redis.conf文件中,里面保存了RDB和AOF两种持久化机制的各种配置。
既然RDB机制是通过把某个时刻的所有数据生成一个快照来保存,那么就应该有一种触发机制,是实现这个过程。对于RDB来说,提供了三种机制:save、bgsave、自动化。我们分别来看一下
1、save触发方式
该命令会阻塞当前Redis服务器,执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止。具体流程如下:
执行完成时候如果存在老的RDB文件,就把新的替代掉旧的。我们的客户端可能都是几万或者是几十万,这种方式显然不可取。
2、bgsave触发方式
执行该命令时,Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。具体流程如下:
具体操作是Redis进程执行fork操作创建子进程,RDB持久化过程由子进程负责,完成后自动结束。阻塞只发生在fork阶段,一般时间很短。基本上 Redis 内部所有的RDB操作都是采用 bgsave 命令。
3、自动触发
自动触发是由我们的配置文件来完成的。在redis.conf配置文件中,里面有如下配置,我们可以去设置:
①save:这里是用来配置触发 Redis的 RDB 持久化条件,也就是什么时候将内存中的数据保存到硬盘。比如“save m n”。表示m秒内数据集存在n次修改时,自动触发bgsave。
默认如下配置:
#表示900 秒内如果至少有 1 个 key 的值变化,则保存save 900 1#表示300 秒内如果至少有 10 个 key 的值变化,则保存save 300 10#表示60 秒内如果至少有 10000 个 key 的值变化,则保存save 60 10000
不需要持久化,那么你可以注释掉所有的 save 行来停用保存功能。
②stop-writes-on-bgsave-error :默认值为yes。当启用了RDB且最后一次后台保存数据失败,Redis是否停止接收数据。这会让用户意识到数据没有正确持久化到磁盘上,否则没有人会注意到灾难(disaster)发生了。如果Redis重启了,那么又可以重新开始接收数据了
③rdbcompression ;默认值是yes。对于存储到磁盘中的快照,可以设置是否进行压缩存储。
④rdbchecksum :默认值是yes。在存储快照后,我们还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。
⑤dbfilename :设置快照的文件名,默认是 dump.rdb
⑥dir:设置快照文件的存放路径,这个配置项一定是个目录,而不能是文件名。
我们可以修改这些配置来实现我们想要的效果。因为第三种方式是配置的,所以我们对前两种进行一个对比:
4、RDB 的优势和劣势
①、优势
(1)RDB文件紧凑,全量备份,非常适合用于进行备份和灾难恢复。
(2)生成RDB文件的时候,redis主进程会fork()一个子进程来处理所有保存工作,主进程不需要进行任何磁盘IO操作。
(3)RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。
②、劣势
RDB快照是一次全量备份,存储的是内存数据的二进制序列化形式,存储上非常紧凑。当进行快照持久化时,会开启一个子进程专门负责快照持久化,子进程会拥有父进程的内存数据,父进程修改内存子进程不会反应出来,所以在快照持久化期间修改的数据不会被保存,可能丢失数据。
AOF机制
全量备份总是耗时的,有时候我们提供一种更加高效的方式AOF,工作机制很简单,redis会将每一个收到的写命令都通过write函数追加到文件中。通俗的理解就是日志记录。
1、持久化原理
他的原理看下面这张图:
每当有一个写命令过来时,就直接保存在我们的AOF文件中。
2、文件重写原理
AOF的方式也同时带来了另一个问题。持久化文件会变的越来越大。为了压缩aof的持久化文件。redis提供了bgrewriteaof命令。将内存中的数据以命令的方式保存到临时文件中,同时会fork出一条新进程来将文件重写。
重写aof文件的操作,并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似。
3、AOF也有三种触发机制
(1)每修改同步always:同步持久化 每次发生数据变更会被立即记录到磁盘 性能较差但数据完整性比较好
(2)每秒同步everysec:异步操作,每秒记录 如果一秒内宕机,有数据丢失
(3)不同no:从不同步
4、优点
(1)AOF可以更好的保护数据不丢失,一般AOF会每隔1秒,通过一个后台线程执行一次fsync操作,最多丢失1秒钟的数据。(2)AOF日志文件没有任何磁盘寻址的开销,写入性能非常高,文件不容易破损。
(3)AOF日志文件即使过大的时候,出现后台重写操作,也不会影响客户端的读写。
(4)AOF日志文件的命令通过非常可读的方式进行记录,这个特性非常适合做灾难性的误删除的紧急恢复。比如某人不小心用flushall命令清空了所有数据,只要这个时候后台rewrite还没有发生,那么就可以立即拷贝AOF文件,将最后一条flushall命令给删了,然后再将该AOF文件放回去,就可以通过恢复机制,自动恢复所有数据
5、缺点
(1)对于同一份数据来说,AOF日志文件通常比RDB数据快照文件更大
(2)AOF开启后,支持的写QPS会比RDB支持的写QPS低,因为AOF一般会配置成每秒fsync一次日志文件,当然,每秒一次fsync,性能也还是很高的
(3)以前AOF发生过bug,就是通过AOF记录的日志,进行数据恢复的时候,没有恢复一模一样的数据出来。
RDB和AOF到底该如何选择
选择的话,两者加一起才更好。因为两个持久化机制你明白了,剩下的就是看自己的需求了,需求不同选择的也不一定,但是通常都是结合使用。有一张图可供总结: