Redis 基础知识

Redis基本数据类型

enter image description here

常用指令

序号数据结构常用命令命令实例
1String1.set :设置 key 对应的 value 值
2.get : 获取对应 key 的值,如不存在返回 nil
3.setnx : 只有设置的值不存在,才设置
4.setex :设置键值,并指定对应的有效期
5.mset/mget : 一次设置/获取多个 key 的值
6.incr/decr : 对 key 值进行增加 / 减去 1 操作
1.set name “tom”
2.get name 结果 :tom
3.setnx name “jim”
4.setex name 10 “tom”
5.mset key1 “hh” key2 “kk”
6.+1/-1
2list1.lpush/rpush :在 key 所对应的 list 左 / 右部添加一个元素
2.lrang/lindex :获取列表给定范围 / 位置的所有值
3.lset :设置 list 中指定下表元素的值
1.lpush listname value1; rpush listname value2
2.lrang listname 0 -1 获取列表所有元素
3.lset list
name 1 valuex
3set1.sadd :向名称 为key 的 set 添加元素
2.smembers :查看集合中的所有成员
3.spop :随机返回并删除 set 中一个元素
4.sdiff :返回所有 set 与第一个 set 的差集
5.sunion :返回给定集合并集
1.sadd wordset aa; sadd wordiest bb;
2.smembers wordset
3.spop wordset
4.sdiff wordset wordset1
5.sunion wordset wordset1
4hash1.hset :设置一个 hash 的 field 的指定值,如果 key 不存在先创建
2.hget :获取某个 hash 的某个 filed 值
3.hmset/hmget :批量设置 / 获取 hash 内容
4.hlen :返回 hash 表中 key 的数量
5.hkeys/hvals :返回 hash 表中所有的 key/value
1.hset user name “tom"
2.hget user name
3.hmget user name sex
4.hlen user
5.hkeys user / hvals user
5Sorted set1.zadd :将一个带有给定分值的成员添加到有序集合里面
2.zrange :取出集合中的元素
3.zcard :返回集合中所有元素的个数
1.zadd key 1 hello
2.zrang key 0 -1
3.zcard key

Redis相比其他缓存,有一个非常大的优势,就是支持多种数据类型。

 

数据类型说明
string字符串,最简单的k-v存储
hashhash格式,value为field和value,适合ID-Detail这样的场景。
list简单的list,顺序列表,支持首位或者末尾插入数据
set无序list,查找速度快,适合交集、并集、差集处理
sorted set有序的set

 

其实,通过上面的数据类型的特性,基本就能想到合适的应用场景了。

  • string——适合最简单的k-v存储,类似于memcached的存储结构,短信验证码,配置信息等,就用这种类型来存储。
  • hash——一般key为ID或者唯一标示,value对应的就是详情了。如商品详情,个人信息详情,新闻详情等。
  • list——因为list是有序的,比较适合存储一些有序且数据相对固定的数据。如省市区表、字典表等。因为list是有序的,适合根据写入的时间来排序,如:最新的***,消息队列等。
  • set——可以简单的理解为ID-List的模式,如微博中一个人有哪些好友,set最牛的地方在于,可以对两个set提供交集、并集、差集操作。例如:查找两个人共同的好友等。
  • Sorted Set——是set的增强版本,增加了一个score参数,自动会根据score的值进行排序。比较适合类似于top 10等不根据插入的时间来排序的数据。

 

应用案例

字符串位操作

网站用户的上线次数统计(活跃用户)

巧用SETBIT
用户ID为key , 天作为offset, 上线设置为1
例如:ID为500的用户,今年第一天上线,第30天上线

SETBIT apeit:user:500 1 1         //设置apeit用户id为500在第1天上线
SETBIT apeit:user:500 30 1       //设置apeit用户id为500在第30天上线
SETBIT apeit:user:121 2 1        
SETBIT apeit:user:134 5 1         
BITCOUNT apeit:user:500         //统计apeit用户id为500的上线次数
KEYS apeit:user:*                      //查找apeit所有用户

操作过程:
redis-use-setbit01.png

按天统计网站活跃用户

天作为key, 用户ID作为offset, 上线设置为1

SETBIT 20181023 500 1            //设置用户id为500的用户在2018-10-23上线
SETBIT 20181023 1 1
BITBOUNT 20181023                 //2018-10-23用户活跃数量
BITOP OR 20181023-25 20181023 20181024 20181025 //对20181023 20181024 20181025这三天进行位or操作,就是这三天总共上线的用户存入到20181023-25键里面。
BITCOUNT  20181023-25         //对20181023-25之间的用户活跃数量

操作过程:
redis-use-setbit02.png

hash

微博好友关注列表

用户ID为key, Field 为好友ID, Value为关注时间。

HMset apeit:user:1001 apeit:user:606 20181020 apeit:user:user:230 20181014 apeit:user:450 20180810   
//设置apeit的用户id为1001的关注的的好友。2018-10-20关注了id为606的用户。
HKEYS apeit:user:1001    //获取用户关注的列表
HLEN apeit:user:1001     //获取用户关注的人数

操作过程:
redis-use-hash01.png

用户维度统计

统计数包括:关注数,粉丝数,喜欢商品数,发帖数
统计数为key, 不同维度为Field, Value 为统计数
关注了5人示例:

HSET apeit:user:10000 follow 5    //1000用户关注了5人
HINCRBY apeit:user:10000 follow 1      //用户又关注了1人
HINCRBY apeit:user:10000 follow -1      //用户取消关注1人

操作过程:
redis-use-hash02.png

set集合

新浪微博共同关注

需求:当用户访问另一个用户的时候,会显示出两个用户工同关注哪些相同的用户。
设计:将每个用户关注的用户放在集合中,求交集即可。
redis:SINTER

SADD apeit zhangqiulong xiaobang xiaosong xiaolin xiaoxiao   //设置apeit关注了zhangqiulong xiaobang...
SADD beiyan zhangqiulong lisi laowang xiaozhang xiaobang    //设置beiyan关注了zhangqiulong lisi...
SINTER apeit beiyan  //求用户apeit和beiyan的共同关注用户

操作过程:
redis-use-set01.png

其他实现方式:数据库取出两个用户关联数据。然后用array_intersect()计算数组交集。

京东多条件查询产品时

搜男生鞋子,选择鸿星尔克,运动鞋,青年
处理:
将鞋子鸿星尔克建一个集合
将运动鞋建一个集合
将青年鞋子建一个集合
然后取交集

sadd hongxingerke erke01 erke02 erke03 erke 04   //设置鸿星尔克鞋子
sadd sport erke01 erke02 nike01 nike02 teibu01 teibu02     //设置运动鞋有哪些 
sadd young erke02 nike01 teibu01     //设置青年鞋
SINTER hongxingerke sport young    //取鸿星尔克,运动鞋,青年鞋交集

操作过程:
redis-use-set02.png

sort set 有序集合

网易音乐排行榜

分析:
每首歌的歌名作为元素
每首歌的播放次数作为分值
ZREVRANGE 来获取播放次数最多的歌曲。
示例:

zadd apeitboard 1 "my heart forever" 1 "long de chuan ren" 1 "little start" 1 "my love" 1 "happy birthday to you" 1 "love"
// 设置apeitboard音乐榜的歌曲的播放次数
zincrby apeitboard 10 "my heart forever"   //”my heart forever“这首歌播放次数增加10
zincrby apeitboard 8 "little start"  //"little start" 这首歌播放次数增加5
zrevrange apeitboard 0 9     //apeitboard音乐榜播放次数前10的从高到低排序

操作过程:
redis-use-sortset01.png

新浪微博分页

新闻网站,博客,论坛,搜索引擎,页面列表条目多,都需要分页。
blog 该key中使用时间戳最为score
示例:

zadd blog 1407000000 'apeit blog start'   //设置blog的'apeit blog start'的文章时间戳为score
zadd blog 1447000012 'apeit blog first article'
zadd blog 1547000047 'apeit blog vistor arrival 1000 people'
zadd blog 1547010047 'apeit blog redis article'
zrevrange blog 0 1     //按文章发布时间倒序取最后两篇
zrevrange blog 2 3    //按文章发布时间倒序取第三,第四篇

操作过程:
redis-use-sortset02.png

京东图书畅销榜

单日榜,月榜,年榜
当月单日榜的并集就是月榜。
示例:

zadd bookboard-001 1000 'php' 1500 'redis' 2000 'java'    //设置第一天图书销售情况
zadd bookboard-002 200 'php' 180 'redis' 210 'java'
zadd bookboard-003 500 'php' 200 'redis' 100 'java'
zunionstore bookboard-001:003 3 bookboard-001 bookboard-002 bookboard-003 aggregate sum   
//三天途书销售的累加并存入到bookboard-001:003
zrevrange bookboard-001:003 0 2     //获取这三天图书销售最好的三本

操作过程:
redis-use-sortset03.png


 

redis是一个内存数据库,数据保存在内存中,但是我们都知道内存的数据变化是很快的,也容易发生丢失。幸好Redis还为我们提供了持久化的机制,分别是RDB(Redis DataBase)和AOF(Append Only File)。

在这里假设你已经了解了redis的基础语法,某字母网站都有很好的教程,可以去看。基本使用的文章就不写了,都是一些常用的命令。

下面针对这两种方式来介绍一下。由浅入深。

一、持久化流程

既然redis的数据可以保存在磁盘上,那么这个流程是什么样的呢?

要有下面五个过程:

(1)客户端向服务端发送写操作(数据在客户端的内存中)。

(2)数据库服务端接收到写请求的数据(数据在服务端的内存中)。

(3)服务端调用write这个系统调用,将数据往磁盘上写(数据在系统内存的缓冲区中)。

(4)操作系统将缓冲区中的数据转移到磁盘控制器上(数据在磁盘缓存中)。

(5)磁盘控制器将数据写到磁盘的物理介质中(数据真正落到磁盘上)。

这5个过程是在理想条件下一个正常的保存流程,但是在大多数情况下,我们的机器等等都会有各种各样的故障,这里划分了两种情况:

(1)Redis数据库发生故障,只要在上面的第三步执行完毕,那么就可以持久化保存,剩下的两步由操作系统替我们完成。

(2)操作系统发生故障,必须上面5步都完成才可以。

在这里只考虑了保存的过程可能发生的故障,其实保存的数据也有可能发生损坏,需要一定的恢复机制,不过在这里就不再延伸了。现在主要考虑的是redis如何来实现上面5个保存磁盘的步骤。它提供了两种策略机制,也就是RDB和AOF。

二、RDB机制

RDB其实就是把数据以快照的形式保存在磁盘上。什么是快照呢,你可以理解成把当前时刻的数据拍成一张照片保存下来。

RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘。也是默认的持久化方式,这种方式是就是将内存中数据以快照的方式写入到二进制文件中,默认的文件名为dump.rdb。

在我们安装了redis之后,所有的配置都是在redis.conf文件中,里面保存了RDB和AOF两种持久化机制的各种配置。

既然RDB机制是通过把某个时刻的所有数据生成一个快照来保存,那么就应该有一种触发机制,是实现这个过程。对于RDB来说,提供了三种机制:save、bgsave、自动化。我们分别来看一下

1、save触发方式

该命令会阻塞当前Redis服务器,执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止。具体流程如下:

 

执行完成时候如果存在老的RDB文件,就把新的替代掉旧的。我们的客户端可能都是几万或者是几十万,这种方式显然不可取。

2、bgsave触发方式

执行该命令时,Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。具体流程如下:

 

具体操作是Redis进程执行fork操作创建子进程,RDB持久化过程由子进程负责,完成后自动结束。阻塞只发生在fork阶段,一般时间很短。基本上 Redis 内部所有的RDB操作都是采用 bgsave 命令。

3、自动触发

自动触发是由我们的配置文件来完成的。在redis.conf配置文件中,里面有如下配置,我们可以去设置:

①save:这里是用来配置触发 Redis的 RDB 持久化条件,也就是什么时候将内存中的数据保存到硬盘。比如“save m n”。表示m秒内数据集存在n次修改时,自动触发bgsave。

默认如下配置:

#表示900 秒内如果至少有 1 个 key 的值变化,则保存save 900 1#表示300 秒内如果至少有 10 个 key 的值变化,则保存save 300 10#表示60 秒内如果至少有 10000 个 key 的值变化,则保存save 60 10000

不需要持久化,那么你可以注释掉所有的 save 行来停用保存功能。

②stop-writes-on-bgsave-error :默认值为yes。当启用了RDB且最后一次后台保存数据失败,Redis是否停止接收数据。这会让用户意识到数据没有正确持久化到磁盘上,否则没有人会注意到灾难(disaster)发生了。如果Redis重启了,那么又可以重新开始接收数据了

③rdbcompression ;默认值是yes。对于存储到磁盘中的快照,可以设置是否进行压缩存储。

④rdbchecksum :默认值是yes。在存储快照后,我们还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。

⑤dbfilename :设置快照的文件名,默认是 dump.rdb

⑥dir:设置快照文件的存放路径,这个配置项一定是个目录,而不能是文件名。

我们可以修改这些配置来实现我们想要的效果。因为第三种方式是配置的,所以我们对前两种进行一个对比:

 

4、RDB 的优势和劣势

①、优势

(1)RDB文件紧凑,全量备份,非常适合用于进行备份和灾难恢复。

(2)生成RDB文件的时候,redis主进程会fork()一个子进程来处理所有保存工作,主进程不需要进行任何磁盘IO操作。

(3)RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。

②、劣势

RDB快照是一次全量备份,存储的是内存数据的二进制序列化形式,存储上非常紧凑。当进行快照持久化时,会开启一个子进程专门负责快照持久化,子进程会拥有父进程的内存数据,父进程修改内存子进程不会反应出来,所以在快照持久化期间修改的数据不会被保存,可能丢失数据。

三、AOF机制

全量备份总是耗时的,有时候我们提供一种更加高效的方式AOF,工作机制很简单,redis会将每一个收到的写命令都通过write函数追加到文件中。通俗的理解就是日志记录。

1、持久化原理

他的原理看下面这张图:

 

每当有一个写命令过来时,就直接保存在我们的AOF文件中。

2、文件重写原理

AOF的方式也同时带来了另一个问题。持久化文件会变的越来越大。为了压缩aof的持久化文件。redis提供了bgrewriteaof命令。将内存中的数据以命令的方式保存到临时文件中,同时会fork出一条新进程来将文件重写。

 

重写aof文件的操作,并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似。

3、AOF也有三种触发机制

(1)每修改同步always:同步持久化 每次发生数据变更会被立即记录到磁盘 性能较差但数据完整性比较好

(2)每秒同步everysec:异步操作,每秒记录 如果一秒内宕机,有数据丢失

(3)不同no:从不同步

 

4、优点

(1)AOF可以更好的保护数据不丢失,一般AOF会每隔1秒,通过一个后台线程执行一次fsync操作,最多丢失1秒钟的数据。(2)AOF日志文件没有任何磁盘寻址的开销,写入性能非常高,文件不容易破损。

(3)AOF日志文件即使过大的时候,出现后台重写操作,也不会影响客户端的读写。

(4)AOF日志文件的命令通过非常可读的方式进行记录,这个特性非常适合做灾难性的误删除的紧急恢复。比如某人不小心用flushall命令清空了所有数据,只要这个时候后台rewrite还没有发生,那么就可以立即拷贝AOF文件,将最后一条flushall命令给删了,然后再将该AOF文件放回去,就可以通过恢复机制,自动恢复所有数据

 

(1)对于同一份数据来说,AOF日志文件通常比RDB数据快照文件更大

(2)AOF开启后,支持的写QPS会比RDB支持的写QPS低,因为AOF一般会配置成每秒fsync一次日志文件,当然,每秒一次fsync,性能也还是很高的

(3)以前AOF发生过bug,就是通过AOF记录的日志,进行数据恢复的时候,没有恢复一模一样的数据出来。

四、RDB和AOF到底该如何选择

选择的话,两者加一起才更好。因为两个持久化机制你明白了,剩下的就是看自己的需求了,需求不同选择的也不一定,但是通常都是结合使用。有一张图可供总结:

 

对比了这几个特性,剩下的就是看自己了。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值