@Redis--数据类型及使用场景

最新推荐文章于 2024-05-06 20:56:01 发布

李莲花*

最新推荐文章于 2024-05-06 20:56:01 发布

阅读量1.1k

点赞数

分类专栏： java Redis 文章标签： redis 数据库缓存 java 面试

本文链接：https://blog.csdn.net/weixin_45992021/article/details/127095549

版权

java 同时被 2 个专栏收录

56 篇文章 0 订阅

订阅专栏

Redis

10 篇文章 0 订阅

订阅专栏

title: Redis
author: YangShen
tags:

Redis
categories:
java学习
Redis
abbrlink: bae4ff13
date: 2021-12-08 15:27:00

Redis基础

2. 数据类型

在这里插入图片描述

在这个部分，我们将学习一共要学习三大块内容，首先需要了解一下数据类型，接下来将针对着我们要学习的数据类型进行逐一的讲解，如string、hash、list、set等，最后我们通过一个案例来总结前面的数据类型的使用场景。

2.1 数据存储类型介绍

2.1.1 业务数据的特殊性

在讲解数据类型之前，我们得先思考一个问题，数据类型既然是用来描述数据的存储格式的，如果你不知道哪些数据未来会进入到我们来的redis中，那么对应的数据类型的选择，你就会出现问题，我们一块来看一下：

（1）原始业务功能设计

秒杀。他这个里边数据变化速度特别的快，访问量也特别的高，用户大量涌入以后都会针对着一部分数据进行操作，这一类要记住。

618活动。对于我们京东的618活动、以及天猫的双11活动，相信大家不用说都知道这些数据一定要进去，因为他们的访问频度实在太高了。

排队购票。我们12306的票务信息。这些信息在原始设计的时候，他们就注定了要进redis。

（2）运营平台监控到的突发高频访问数据

此类平台临时监控到的这些数据，比如说现在出来的一个八卦的信息，这个新闻一旦出现以后呢，顺速的被围观了，那么这个时候，这个数据就会变得访量特别高，那么这类信息也要进入进去。

（3）高频、复杂的统计数据

在线人数。比如说直播现在很火，直播里边有很多数据，例如在线人数。进一个人出一个人，这个数据就要跳动，那么这个访问速度非常的快，而且访量很高，并且它里边有一个复杂的数据统计，在这里这种信息也要进入到我们的redis中。

投票排行榜。投票投票类的信息他的变化速度也比较快，为了追求一个更快的一个即时投票的名次变化，这种数据最好也放到redis中。

2.1.2 Redis 数据类型(5种常用)

基于以上数据特征我们进行分析，最终得出来我们的Redis中要设计5种数据类型：

string、hash、list、set、sorted_set/zset（应用性较低）

2.2 string数据类型

在学习第一个数据类型之前，先给大家介绍一下，在随后这部分内容的学习过程中，我们每一种数据类型都分成三块来讲：首先是讲下它的基本操作，接下来讲一些它的扩展操作，最后我们会去做一个小的案例分析。

2.2.1Redis 数据存储格式

在学习string这个数据形式之前，我们先要明白string到底是修饰什么的？
我们知道redis 自身是一个 Map，其中所有的数据都是采用 key : value 的形式存储。
对于这种结构来说，我们用来存储数据一定是一个值前面对应一个名称。我们通过名称来访问后面的值。按照这种形势，我们可以对出来我们的存储格式。前面这一部分我们称为key。后面的一部分称为value，而我们的数据类型，他一定是修饰value的。数据类型指的是存储的数据的类型，也就是 value 部分的类型，key 部分永远都是字符串。

2.2.2 string 类型

（1）存储的数据：单个数据，最简单的数据存储类型，也是最常用的数据存储类型。string，他就是存一个字符串儿，注意是value那一部分是一个字符串，它是redis中最基本、最简单的存储数据的格式。

（2）存储数据的格式：一个存储空间保存一个数据。每一个空间中只能保存一个字符串信息，这个信息里边如果是存的纯数字，他也能当数字使用，我们来看一下，这是我们的数据的存储空间。

（3）存储内容：通常使用字符串，如果字符串以整数的形式展示，可以作为数字操作使用.

一个key对一个value，而这个itheima就是我们所说的string类型，当然它也可以是一个纯数字的格式。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VoVez4RT-1664364833829)(https://www.yuque.com/api/filetransfer/images?url=https%3A%2F%2Fblog-1259153703.cos.ap-nanjing.myqcloud.com%2Fimages%2F20211208200215.png&sign=8206e4c1b864b6a55adef05d3f38926419a0a41e0245cf3dcf3547dc2921fd63#crop=0&crop=0&crop=1&crop=1&from=url&id=VnfVN&originHeight=225&originWidth=2126&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=shadow&title=)]

2.2.3 string 类型数据的基本操作

（1）基础指令

添加/修改数据添加/修改数据

set key value

获取数据

get key

删除数据

del key

判定性添加数据

setnx key value

添加/修改多个数据

mset key1 value1 key2 value2 …

获取多个数据

mget key1 key2 …

获取数据字符个数（字符串长度）

strlen key

追加信息到原始信息后部（如果原始信息存在就追加，否则新建）

append key value

（2）单数据操作与多数据操作的选择之惑

即set 与mset的关系。这对于这两个操作来说，没有什么你应该选哪个，而是他们自己的特征是什么，你要根据这个特征去比对你的业务，看看究竟适用于哪个。

假如说这是我们现在的服务器，他要向redis要数据的话，它会发出一条指令。那么当这条指令发过来的时候，比如说是这个set指令过来，那么它会把这个结果返回给你，这个时候我们要思考这里边一共经过了多长时间。

首先，发送set指令要时间，这是网络的一个时间，接下来redis要去运行这个指令要消耗时间，最终把这个结果返回给你又有一个时间，这个时间又是一个网络的时间，那我们可以理解为：一个指令发送的过程中需要消耗这样的时间.

但是如果说现在不是一条指令了，你要发3个set的话，还要多长时间呢？对应的发送时间要乘3了，因为这是三个单条指令,而运行的操作时间呢，它也要乘3了，但最终返回的也要发3次，所以这边也要乘3。

于是我们可以得到一个结论：单指令发3条它需要的时间，假定他们两个一样，是6个网络时间加3个处理时间，如果我们把它合成一个mset呢，我们想一想。

假如说用多指令发3个指令的话，其实只需要发一次就行了。这样我们可以得到一个结论，多指令发3个指令的话，其实它是两个网络时间加上3个redis的操作时间，为什么这写一个小加号呢，就是因为毕竟发的信息量变大了，所以网络时间有可能会变长。

![20211208200214.png](https://img-blog.csdnimg.cn/img_convert/9a8fcc2aa769b4e8377703d3cb353e83.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=908&id=ua0059a37&name=20211208200214.png&originHeight=1022&originWidth=2114&originalType=binary&ratio=1&rotation=0&showTitle=false&size=307541&status=error&style=shadow&taskId=u807aff02-7eef-47a5-ae4f-90f61f665e6&title=&width=1879.111111111111)

那么通过这张图，你就可以得到一个结论，我们单指令和多指令他们的差别就在于你发送的次数是多还是少。当你影响的数据比较少的时候，你可以用单指令，也可以用多指令。但是一旦这个量大了，你就要选择多指令了，他的效率会高一些。

2.3 string 类型数据的扩展操作

2.3.1 string 类型数据的扩展操作

下面我们来看一string的扩展操作，分成两大块：一块是对数字进行操作的，第二块是对我们的key的时间进行操作的。

设置数值数据增加指定范围的值

incr key
incrby key increment
incrbyfloat key increment

设置数值数据减少指定范围的值

decr key
decrby key increment

设置数据具有指定的生命周期

setex key seconds value
psetex key milliseconds value

2.3.2 string 类型数据操作的注意事项

(1)数据操作不成功的反馈与数据正常操作之间的差异

表示运行结果是否成功

(integer) 0  → false                 失败

(integer) 1  → true                  成功

表示运行结果值

(integer) 3  → 3                        3个

(integer) 1  → 1                        1个

(2)数据未获取到时，对应的数据为（nil），等同于null

(3)数据最大存储量：512MB

(4)string在redis内部存储默认就是一个字符串，当遇到增减类操作incr，decr时会转成数值型进行计算

(5)按数值进行操作的数据，如果原始数据不能转成数值，或超越了redis 数值上限范围，将报错
9223372036854775807（java中Long型数据最大值，Long.MAX_VALUE）

(6)redis所有的操作都是原子性的，采用单线程处理所有业务，命令是一个一个执行的，因此无需考虑并发带来的数据影响.

2.4string应用场景与key命名约定

2.4.1 应用场景

它的应用场景在于：主页高频访问信息显示控制，例如新浪微博大V主页显示粉丝数与微博数量。

![20211208200251.png](https://img-blog.csdnimg.cn/img_convert/6762aeaf9088b312d3bb684b02902ec1.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=596&id=u8b20e920&name=20211208200251.png&originHeight=1116&originWidth=1302&originalType=binary&ratio=1&rotation=0&showTitle=false&size=1683181&status=error&style=shadow&taskId=uf3bcb5c4-fca8-43a1-82b8-94f031d3fc7&title=&width=695)

我们来思考一下：这些信息是不是你进入大V的页面儿以后就要读取这写信息的啊，那这种信息一定要存储到我们的redis中，因为他的访问量太高了！那这种数据应该怎么存呢？我们来一块儿看一下方案！

2.4.2 解决方案

（1）在redis中为大V用户设定用户信息，以用户主键和属性值作为key，后台设定定时刷新策略即可。

eg:	user:id:3506728370:fans		→	12210947
eg:	user:id:3506728370:blogs	→	6164
eg:	user:id:3506728370:focuses	→	83

（2）也可以使用json格式保存数据

eg:	user:id:3506728370    →	{“fans”：12210947，“blogs”：6164，“ focuses ”：83 }

（3） key 的设置约定

数据库中的热点数据key命名惯例

	表名	主键名	主键值	字段名
eg1：	order	id	29437595	name
eg2：	equip	id	390472345	type
eg3：	news	id	202004150	title

2.5 hash的基本操作

下面我们来学习第二个数据类型hash。

2.5.1 数据存储的困惑

对象类数据的存储如果具有较频繁的更新需求操作会显得笨重！

在正式学习之前，我们先来看一个关于数据存储的困惑：

比如说前面我们用以上形式存了数据，如果我们用单条去存的话，它存的条数会很多。但如果我们用json格式，它存一条数据就够了。问题来了，假如说现在粉丝数量发生变化了，你要把整个值都改了。但是用单条存的话就不存在这个问题，你只需要改其中一个就行了。这个时候我们就想，有没有一种新的存储结构，能帮我们解决这个问题呢。

我们一块儿来分析一下：

如上图所示：单条的话是对应的数据在后面放着。仔细观察：我们看左边是不是长得都一模一样啊，都是对应的表名、ID等的一系列的东西。我们可以将右边红框中的这个区域给他封起来。

那如果要是这样的形式的话，如下图，我们把它一合并，并把右边的东西给他变成这个格式，这不就行了吗？
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zDSAyVwL-1664364833833)(https://www.yuque.com/api/filetransfer/images?url=https%3A%2F%2Fblog-1259153703.cos.ap-nanjing.myqcloud.com%2Fimages%2F20211208200222.png&sign=cb00985d352369d844517205dd72839a3d33814f22bb92be725f96ef3720e0fc#crop=0&crop=0&crop=1&crop=1&from=url&id=hV6LX&originHeight=525&originWidth=1540&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=shadow&title=)]

这个图其实大家并不陌生，第一，你前面学过一个东西叫hashmap不就这格式吗？第二，redis自身不也是这格式吗？那是什么意思呢？注意，这就是我们要讲的第二种格式，hash。

在右边对应的值，我们就存具体的值，那左边儿这就是我们的key。问题来了，那中间的这一块叫什么呢？这个东西我们给他起个名儿，叫做field字段。那么右边儿整体这块儿空间我们就称为hash，也就是说hash是存了一个key value的存储空间。

2.5.2 hash 类型

新的存储需求：对一系列存储的数据进行编组，方便管理，典型应用存储对象信息

需要的存储结构：一个存储空间保存多个键值对数据

hash类型：底层使用哈希表结构实现数据存储

![20211208200218.png](https://img-blog.csdnimg.cn/img_convert/d43268e7dc6e3a21e65f1f9b6f165aad.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=642&id=ued1619dd&name=20211208200218.png&originHeight=722&originWidth=1182&originalType=binary&ratio=1&rotation=0&showTitle=false&size=37306&status=error&style=shadow&taskId=u6ef3ae50-f33a-4fe1-ab0b-a5df4d55653&title=&width=1050.6666666666667)

如上图所示，这种结构叫做hash，左边一个key，对右边一个存储空间。这里要明确一点，右边这块儿存储空间叫hash，也就是说hash是指的一个数据类型，他指的不是一个数据，是这里边的一堆数据，那么它底层呢，是用hash表的结构来实现的。

值得注意的是：

如果field数量较少，存储结构优化为类数组结构
如果field数量较多，存储结构使用HashMap结构

2.5.3 hash 类型数据的基本操作

添加/修改数据

hset key field value

获取数据

hget key field
hgetall key

删除数据

hdel key field1 [field2]

设置field的值，如果该field存在则不做任何操作

hsetnx key field value

添加/修改多个数据

hmset key field1 value1 field2 value2 …

获取多个数据

hmget key field1 field2 …

获取哈希表中字段的数量

hlen key

获取哈希表中是否存在指定的字段

hexists key field

2.6 hash的拓展操作

在看完hash的基本操作后，我们再来看他的拓展操作，他的拓展操作相对比较简单：

2.6.1 hash 类型数据扩展操作

获取哈希表中所有的字段名或字段值

hkeys key
hvals key

设置指定字段的数值数据增加指定范围的值

hincrby key field increment
hincrbyfloat key field increment

2.6.2 hash类型数据操作的注意事项

(1)hash类型中value只能存储字符串，不允许存储其他数据类型，不存在嵌套现象。如果数据未获取到，对应的值为（nil）。
![20211208200223.png](https://img-blog.csdnimg.cn/img_convert/30295d3c6c60a638fef7c2e5bace9735.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=688&id=u72a92f81&name=20211208200223.png&originHeight=774&originWidth=1280&originalType=binary&ratio=1&rotation=0&showTitle=false&size=40592&status=error&style=shadow&taskId=u2c435654-3b0b-4275-84ce-32445cf23f9&title=&width=1137.7777777777778)

(2）每个 hash 可以存储 232 - 1 个键值对
hash类型十分贴近对象的数据存储形式，并且可以灵活添加删除对象属性。但hash设计初衷不是为了存储大量对象而设计的，切记不可滥用，更不可以将hash作为对象列表使用。

(3)hgetall 操作可以获取全部属性，如果内部field过多，遍历整体数据效率就很会低，有可能成为数据访问瓶颈。

2.7 hash应用场景

2.7.1 应用场景

双11活动日，销售手机充值卡的商家对移动、联通、电信的30元、50元、100元商品推出抢购活动，每种商品抢购上限1000 张。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DKNA8Uf3-1664364833837)(https://www.yuque.com/api/filetransfer/images?url=https%3A%2F%2Fblog-1259153703.cos.ap-nanjing.myqcloud.com%2Fimages%2F20211208200219.png&sign=4bd6ff22de93656d6ca1a2750dfbb52c5e912af859b0a8ebe98b2ca0d03c6c1a#crop=0&crop=0&crop=1&crop=1&from=url&id=E77l2&originHeight=796&originWidth=2270&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=shadow&title=)]

也就是商家有了，商品有了，数量有了。最终我们的用户买东西就是在改变这个数量。那你说这个结构应该怎么存呢？对应的商家的ID作为key，然后这些充值卡的ID作为field，最后这些数量作为value。而我们所谓的操作是其实就是increa这个操作，只不过你传负值就行了。看一看对应的解决方案：

2.7.2 解决方案

以商家id作为key
将参与抢购的商品id作为field
将参与抢购的商品数量作为对应的value
抢购时使用降值的方式控制产品数量

注意：实际业务中还有超卖等实际问题，这里不做讨论

2.8 list基本操作

前面我们存数据的时候呢，单个数据也能存，多个数据也能存，但是这里面有一个问题，我们存多个数据用hash的时候它是没有顺序的。我们平时操作，实际上数据很多情况下都是有顺序的，那有没有一种能够用来存储带有顺序的这种数据模型呢，list就专门来干这事儿。

2.8.1 list 类型

数据存储需求：存储多个数据，并对数据进入存储空间的顺序进行区分

需要的存储结构：一个存储空间保存多个数据，且通过数据可以体现进入顺序

list类型：保存多个数据，底层使用双向链表存储结构实现

先来通过一张图，回忆一下顺序表、链表、双向链表。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YIzNSyKI-1664364833838)(https://www.yuque.com/api/filetransfer/images?url=https%3A%2F%2Fblog-1259153703.cos.ap-nanjing.myqcloud.com%2Fimages%2F20211208200220.png&sign=2fdcc12e0db409cc127aaa95ae8add6e3526adb2b69246d2f1a41ef1a510044d#crop=0&crop=0&crop=1&crop=1&from=url&id=AiTA3&originHeight=675&originWidth=2017&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=shadow&title=)]

list对应的存储结构是什么呢？里边存的这个东西是个列表，他有一个对应的名称。就是key存一个list的这样结构。对应的基本操作，你其实是可以想到的。

![20211208200221.png](https://img-blog.csdnimg.cn/img_convert/ebd333eef715a2386f03e5adb91eadbe.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=692&id=ud47c1a1d&name=20211208200221.png&originHeight=779&originWidth=1782&originalType=binary&ratio=1&rotation=0&showTitle=false&size=34786&status=error&style=shadow&taskId=uc3e1f4c0-47d4-48cb-a58c-5313190f64c&title=&width=1584)

来看一下，因为它是双向的，所以他左边右边都能操作，它对应的操作结构两边都能进数据。这就是链表的一个存储结构。往外拿数据的时候怎么拿呢？通常是从一端拿，当然另一端也能拿。如果两端都能拿的话，这就是个双端队列，两边儿都能操作。如果只能从一端进一端出，这个模型咱们前面了解过，叫做栈。

2.8.2 list 类型数据基本操作

最后看一下他的基本操作

添加/修改数据

lpush key value1 [value2] ……
rpush key value1 [value2] ……

获取数据

lrange key start stop
lindex key index
llen key

获取并移除数据

lpop key
rpop key

2.9 list扩展操作

2.9.1 list 类型数据扩展操作

移除指定数据

lrem key count value

规定时间内获取并移除数据

blpop key1 [key2] timeout
brpop key1 [key2] timeout
brpoplpush source destination timeout

2.9.2 list 类型数据操作注意事项

（1）list中保存的数据都是string类型的，数据总容量是有限的，最多232 - 1 个元素(4294967295)。

（2）list具有索引的概念，但是操作数据时通常以队列的形式进行入队出队操作，或以栈的形式进行入栈出栈操作

（3）获取全部数据操作结束索引设置为-1

（4）list可以对数据进行分页操作，通常第一页的信息来自于list，第2页及更多的信息通过数据库的形式加载

2.10 list 应用场景

2.10.1 应用场景

企业运营过程中，系统将产生出大量的运营数据，如何保障多台服务器操作日志的统一顺序输出？

![20211208200224.png](https://img-blog.csdnimg.cn/img_convert/6c865d12ddffee71f5417a9b833afbe5.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=767&id=ua4a927dc&name=20211208200224.png&originHeight=863&originWidth=2138&originalType=binary&ratio=1&rotation=0&showTitle=false&size=357720&status=error&style=shadow&taskId=ufe379d24-8e94-4292-963a-d079ea7055b&title=&width=1900.4444444444443)

假如现在你有多台服务器，每一台服务器都会产生它的日志，假设你是一个运维人员，你想看它的操作日志，你怎么看呢？打开A机器的日志看一看，打开B机器的日志再看一看吗？这样的话你会可能会疯掉的！因为左边看的有可能它的时间是11:01，右边11:02，然后再看左边11:03，它们本身是连续的，但是你在看的时候就分成四个文件了，这个时候你看起来就会很麻烦。能不能把他们合并呢？答案是可以的！怎么做呢？建立起redis服务器。当他们需要记日志的时候，记在哪儿,全部发给redis。等到你想看的时候，通过服务器访问redis获取日志。然后得到以后，就会得到一个完整的日志信息。那么这里面就可以获取到完整的日志了，依靠什么来实现呢？就依靠我们的list的模型的顺序来实现。进来一组数据就往里加，谁先进来谁先加进去，它是有一定的顺序的。

2.10.2 解决方案

依赖list的数据具有顺序的特征对信息进行管理
使用队列模型解决多路信息汇总合并的问题
使用栈模型解决最新消息的问题

如何保障多台服务器操作日志统一顺序输出？(假如现在你有多台服务器，每一台服务器都会产生它的日志，假设你是一个运维人员，你想看它的操作日志，你怎么看呢？打开A机器的日志看一看，打开B机器的日志再看一看吗？这样的话你会可能会疯掉的！) 我们将记的日志全部发给redis , redis的list模型有顺序的把日志整理存储好, 访问redis就会获取到完整的有序的日志了

2.11 set 基本操作

2.11.1 set类型

新的存储需求：存储大量的数据，在查询方面提供更高的效率

需要的存储结构：能够保存大量的数据，高效的内部存储机制，便于查询

set类型：与hash存储结构完全相同，仅存储键，不存储值（nil），并且值是不允许重复的

![20211208200223.png](https://img-blog.csdnimg.cn/img_convert/e06a8c4c69471cf21c920ddb29164473.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=688&id=u3796fdaf&name=20211208200223.png&originHeight=774&originWidth=1280&originalType=binary&ratio=1&rotation=0&showTitle=false&size=40592&status=error&style=shadow&taskId=u745f4b0f-ada3-400a-b5ff-c76a4070c0e&title=&width=1137.7777777777778)

通过这个名称，大家也基本上能够认识到和我们Java中的set完全一样。我们现在要存储大量的数据，并且要求提高它的查询效率。用list这种链表形式，它的查询效率是不高的，那怎么办呢？这时候我们就想，有没有高效的存储机制。其实前面咱讲Java的时候说过hash表的结构就非常的好，但是这里边我们已经有hash了，他做了这么一个设定，干嘛呢，他把hash的存储空间给改一下，右边你原来存数据改掉,全部存空，那你说数据放哪儿了？放到原来的filed的位置，也就在这里边存真正的值，那么这个模型就是我们的set 模型。

看一下它的整个结构：

![20211208200225.png](https://img-blog.csdnimg.cn/img_convert/3a2b1e3e279ee0baa037c378ea136e54.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=504&id=ue44ed04e&name=20211208200225.png&originHeight=567&originWidth=1300&originalType=binary&ratio=1&rotation=0&showTitle=false&size=38806&status=error&style=shadow&taskId=u234c3562-7cbc-46ba-9adb-362fcc98492&title=&width=1155.5555555555557)

2.11.2 set类型数据的基本操作

添加数据

sadd key member1 [member2]

获取全部数据

smembers key

删除数据

srem key member1 [member2]

获取集合数据总量

scard key

判断集合中是否包含指定数据

sismember key member

随机获取集合中指定数量的数据

srandmember key [count]

随机获取集中的某个数据并将该数据移除集合

spop key [count]

2.12 set 类型数据的扩展操作

2.12.1 set 类型数据的扩展操作

求两个集合的交、并、差集

sinter key1 [key2 …]  
sunion key1 [key2 …]  
sdiff key1 [key2 …]

求两个集合的交、并、差集并存储到指定集合中

sinterstore destination key1 [key2 …]  
sunionstore destination key1 [key2 …]  
sdiffstore destination key1 [key2 …]

将指定数据从原始集合中移动到目标集合中

smove source destination member

通过下面一张图回忆一下交、并、差

![20211208200226.png](https://img-blog.csdnimg.cn/img_convert/abfa78152d2cc88e1363284f5128664d.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=676&id=ud04150a2&name=20211208200226.png&originHeight=761&originWidth=1743&originalType=binary&ratio=1&rotation=0&showTitle=false&size=133208&status=error&style=shadow&taskId=uc81ebb4a-3274-4e77-b46c-dfa7a8fd24a&title=&width=1549.3333333333333)

2.12.2 set 类型数据操作的注意事项

set 类型不允许数据重复，如果添加的数据在 set 中已经存在，将只保留一份。

set 虽然与hash的存储结构相同，但是无法启用hash中存储值的空间。

2.13 set应用场景

2.13.1 set应用场景

（1）黑名单

资讯类信息类网站追求高访问量，但是由于其信息的价值，往往容易被不法分子利用，通过爬虫技术，快速获取信息，个别特种行业网站信息通过爬虫获取分析后，可以转换成商业机密进行出售。例如第三方火车票、机票、酒店刷票代购软件，电商刷评论、刷好评。

同时爬虫带来的伪流量也会给经营者带来错觉，产生错误的决策，有效避免网站被爬虫反复爬取成为每个网站都要考虑的基本问题。在基于技术层面区分出爬虫用户后，需要将此类用户进行有效的屏蔽，这就是黑名单的典型应用。

ps:不是说爬虫一定做摧毁性的工作，有些小型网站需要爬虫为其带来一些流量。

（2）白名单

对于安全性更高的应用访问，仅仅靠黑名单是不能解决安全问题的，此时需要设定可访问的用户群体，依赖白名单做更为苛刻的访问验证。

2.13.2 解决方案

基于经营战略设定问题用户发现、鉴别规则

周期性更新满足规则的用户黑名单，加入set集合
用户行为信息达到后与黑名单进行比对，确认行为去向

黑名单过滤IP地址：应用于开放游客访问权限的信息源

黑名单过滤设备信息：应用于限定访问设备的信息源

黑名单过滤用户：应用于基于访问权限的信息源

2.14 实践案例

2.14.1业务场景

使用微信的过程中，当微信接收消息后，会默认将最近接收的消息置顶，当多个好友及关注的订阅号同时发送消息时，该排序会不停的进行交替。同时还可以将重要的会话设置为置顶。一旦用户离线后，再次打开微信时，消息该按照什么样的顺序显示。

我们分析一下：

![20211208200227.png](https://img-blog.csdnimg.cn/img_convert/91972c66b4a47f47831b3d73e917ac70.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=916&id=u1864f7f9&name=20211208200227.png&originHeight=1031&originWidth=2132&originalType=binary&ratio=1&rotation=0&showTitle=false&size=208059&status=error&style=shadow&taskId=udb9035ad-82b7-410e-aab7-e33a8c51c49&title=&width=1895.111111111111)

100这台手机代表你。而200、300、400这三台代表你好友的手机。在这里有一些东西需要交代一下，因为我们每个人的都会对自己的微信中的一些比较重要的人设置会话置顶，将他的那条对话放在最上面。我们假定这个人有两个会话置顶的好友，分别是400和500，而这里边就包含400.

下面呢，我们就来发这个消息，第一个发消息的是300，他发了个消息给100。发完以后，这个东西应该怎么存储呢？在这里面一定要分开，记录置顶的这些人的会话，对应的会话显示顺序和非置顶的一定要分两。

这里面我们创建两个模型，一个是普通的，一个是置顶的，而上面的这个置顶的用户呢，我们用set来存储，因为不重复。而下面这些因为有顺序，很容易想到用list去存储,不然你怎么表达顺序呢？

那当300发给消息给100以后，这个时候我们先判定你在置顶人群中吗？不在,那好，300的消息对应的顺序就应该放在普通的列表里边。而在这里边，我们把300加进去。第一个数据也就是现在300。

接下来400，发了个消息。判断一下，他是需要置顶的，所以400将进入list的置顶里边放着。当前还没有特殊的地方。

![20211208200229.png](https://img-blog.csdnimg.cn/img_convert/133fd992bbff3db2979a1429ca7152c0.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=851&id=ucebe9509&name=20211208200229.png&originHeight=957&originWidth=2068&originalType=binary&ratio=1&rotation=0&showTitle=false&size=224268&status=error&style=shadow&taskId=ue3948f45-42a0-479d-8818-77b34fe778e&title=&width=1838.2222222222222)

再来200发消息了，和刚才的判定方法一样，先看在不在置顶里，不在的话进普通，然后在普通里边把200加入就行了，OK，到这里目前还没有顺序变化。

接下来200又发消息过来，同一个人给你连发了两条，那这个时候200的消息到达以后，先判断是否在置顶范围，不在，接下来他要放在list普通中，这里你要注意一点，因为这里边已经有200，所以进来以后先干一件事儿，把200杀掉，没有200，然后再把200加进来，那你想一下，现在这个位置顺序是什么呢？就是新的都在右边，对不对？

还记得我们说list模型，如果是一个双端队列，它是可以两头进两头出。当然我们双端从一头进一头出，这就是栈模型，现在咱们运用的就是list模型中的栈模型。

![20211208200230.png](https://img-blog.csdnimg.cn/img_convert/16fe5c582cba526763e4f330f94c39ce.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=847&id=ub12958e1&name=20211208200230.png&originHeight=953&originWidth=2110&originalType=binary&ratio=1&rotation=0&showTitle=false&size=269285&status=error&style=shadow&taskId=u54587005-11c1-4e9f-81f5-492f18003d6&title=&width=1875.5555555555557)

现在300发消息，先判定他在不在，不在，用普通的队列，接下来按照刚才的操作，不管你里边原来有没有300，我先把300杀掉，没了，200自然就填到300的位置了，他现在是list里面唯一一个，然后让300进来，注意是从右侧进来的，那么现在300就是最新的。

![20211208200231.png](https://img-blog.csdnimg.cn/img_convert/f40642fe0a9664e49307125b88eaf9a3.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=886&id=u9efcf978&name=20211208200231.png&originHeight=997&originWidth=2066&originalType=binary&ratio=1&rotation=0&showTitle=false&size=299924&status=error&style=shadow&taskId=u47f8dac0-bb86-4fb1-ad2b-fbb34db12b0&title=&width=1836.4444444444443)

那么到这里呢，我们让100来读取消息。你觉得这个消息顺序应该是什么样的？首先置顶的400有一个，他跑在最上面，然后list普通如果出来的话，300是最新的消息，而200在他后面的。用这种形式，我们就可以做出来他的消息顺序来。

![20211208200233.png](https://img-blog.csdnimg.cn/img_convert/d04a61cb20ed83c255e0fcf786c5da55.png#clientId=ue41db74d-f785-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown error&from=paste&height=917&id=u617dce2a&name=20211208200233.png&originHeight=1032&originWidth=2081&originalType=binary&ratio=1&rotation=0&showTitle=false&size=315227&status=error&style=shadow&taskId=ucab145aa-7511-40e5-8a4c-d20e108b5b9&title=&width=1849.7777777777778)

2.14.2 解决方案

看一下最终的解决方案：

依赖list的数据具有顺序的特征对消息进行管理，将list结构作为栈使用
置顶与普通会话分别创建独立的list分别管理
当某个list中接收到用户消息后，将消息发送方的id从list的一侧加入list（此处设定左侧）
多个相同id发出的消息反复入栈会出现问题，在入栈之前无论是否具有当前id对应的消息，先删除对应id
推送消息时先推送置顶会话list，再推送普通会话list，推送完成的list清除所有数据
消息的数量，也就是微信用户对话数量采用计数器的思想另行记录，伴随list操作同步更新

2.14.3 数据类型总结

总结一下，在整个数据类型的部分，我们主要介绍了哪些内容：

首先我们了解了一下数据类型，接下来针对着我们要学习的数据类型，进行逐一讲解了string、hash、list、set等，最后通过一个案例总结了一下前面的数据类型的使用场景。

Redis数据类型及使用场景
Redis的常用场景有哪些?

1、缓存

缓存现在几乎是所有中大型网站都在用的必杀技，合理的利用缓存不仅能够提升网站访问速度，还能大大降低数据库的压力。Redis提供了键过期功能和灵活的键淘汰策略来保证缓存的命中率。将热点数据放到内存中，设置内存的最大使用量以及淘汰策略来保证缓存的命中率。所以，现在Redis用在缓存的场合非常多。

2、排行榜

很多网站都有排行榜应用的，如京东的月度销量榜单、商品按时间的上新排行榜等。Redis提供的有序集合数据结构能实现各种复杂的排行榜应用。（ZSet 可以实现有序性操作，从而实现排行榜等功能）

3、计数器

什么是计数器，如电商网站商品的浏览量、视频网站视频的播放数等。为了保证数据实时效，每次浏览都得给+1，并发量高时如果每次都请求数据库操作无疑是种挑战和压力。Redis 这种内存型数据库的读写性能非常高，很适合存储频繁读写的计数量。Redis提供的incr命令来实现计数器功能。（String 进行自增自减运算，从而实现计数器功能）

4、分布式会话

集群模式下，在应用不多的情况下一般使用容器自带的session复制功能就能满足，当应用增多相对复杂的系统中，可以使用 Redis 来统一存储多台应用服务器的会话信息。（一般都会搭建以Redis等内存数据库为中心的session服务，session不再由容器管理，而是由session服务及内存数据库管理。）当应用服务器不再存储用户的会话信息，也就不再具有状态，一个用户可以请求任意一个应用服务器，从而更容易实现高可用性以及可伸缩性。

5、分布式锁

在很多互联网公司中都使用了分布式技术，分布式技术带来的技术挑战是对同一个资源的并发访问，如全局ID、减库存、秒杀等场景，并发量不大的场景可以使用数据库的悲观锁、乐观锁来实现，但在并发量高的场合中，利用数据库锁来控制资源的并发访问是不太理想的，大大影响了数据库的性能。在分布式场景下，无法使用单机环境下的锁来对多个节点上的进程进行同步。可以使用 Redis 自带的 SETNX 命令实现分布式锁，如果设置返回1说明获取锁成功，否则获取锁失败，实际应用中要考虑的细节要更多。除此之外，还可以使用官方提供的 RedLock 分布式锁实现。

6、社交网络

点赞、踩、关注/被关注、共同好友等是社交网站的基本功能，社交网站的访问量通常来说比较大，而且传统的关系数据库类型不适合存储这种类型的数据，Redis提供的哈希、集合等数据结构能很方便的的实现这些功能。如在微博中的共同好友，通过Redis的set能够很方便得出。（Set 可以实现交集、并集等操作，从而实现共同好友等功能）

7、最新列表

查找表和缓存类似，也是利用了 Redis 快速的查找特性。Redis列表结构，LPUSH可以在列表头部插入一个内容ID作为关键字，LTRIM可用来限制列表的数量，这样列表永远为N个ID，无需查询最新的列表，直接根据ID去到对应的内容页即可。例如 DNS 记录就很适合使用 Redis 进行存储。但是查找表的内容不能失效，而缓存的内容可以失效，因为缓存不作为可靠的数据来源。

8、消息系统

消息队列是大型网站必用中间件，如ActiveMQ、RabbitMQ、Kafka等流行的消息队列中间件，主要用于业务解耦、流量削峰及异步处理实时性低的业务。Redis提供了发布/订阅及阻塞队列功能，能实现一个简单的消息队列系统。另外，这个不能和专业的消息中间件相比。（List 是一个双向链表，可以通过 lpush 和 rpop 写入和读取消息）。不过最好使用 Kafka、RabbitMQ 等消息中间件。

9、全页缓存（FPC）

除基本的会话token之外，Redis还提供很简便的FPC平台。以Magento为例，Magento提供一个插件来使用Redis作为全页缓存后端。此外，对WordPress的用户来说，Pantheon有一个非常好的插件 wp-redis，这个插件能帮助你以最快速度加载你曾浏览过的页面

Redis的数据类型有哪些？

有五种常用数据类型：String、Hash、Set、List、SortedSet。以及三种特殊的数据类型：Bitmap、HyperLogLog、Geospatial ，其中HyperLogLog、Bitmap的底层都是 String 数据类型，Geospatial 的底层是 Sorted Set 数据类型。

五种常用的数据类型：

1、String：（字符串）String是最常用的一种数据类型，普通的key- value 存储都可以归为此类。一个key对应一个value。String类型是二进制安全的，意思是 redis 的 string 可以包含任何数据。如数字，字符串，jpg图片或者序列化的对象。
使用场景：⼀般常⽤在需要计数的场景，⽐如微博数，粉丝数，⽤户的访问次数、热点⽂章的点赞转发数量等

2、Hash：（字典，包含键值对的无序散列表）Hash 是一个键值(key => value)对集合。Redis hash 是一个 string 类型的 field 和 value 的映射表，内部是数组+链表。hash 特别适合用于存储对象，并且可以像数据库中update一个属性一样只修改某一项属性值。
使用场景：系统中对象数据的存储，相比string更节省空间，能直观的维护缓存信息，如用户信息，视频信息等。

3、Set：（无序集合）Set是一个无序的天然去重的集合，即Key-Set。此外还提供了交集、并集等一系列直接操作集合的方法。
使用场景：需要存放的数据不能重复以及需要获取多个数据源交集和并集，标签给用户添加标签，用户点赞收藏，可以放到set中实现，对于求共同好友、共同关注什么的功能实现都特别方便。

4、List：（列表）List是一个有序可重复的集合，其遵循FIFO的原则，底层是依赖双向链表实现的，因此支持正向、反向双重查找。通过List，我们可以地很方便获得类似于最新回复这类的功能实现。
使用场景：存储一些列表型的数据结构，类似粉丝列表、文章的评论列表之类的数据

5、SortedSet：（有序集合）类似于java中的TreeSet，是Set的可排序版。此外还支持优先级排序，它给每个元素设置一个分数，作为排序的依据。
使用场景：适用于排行榜和带权重的消息队列等场景。

三种特殊的数据类型：

1、Bitmap：位图，Bitmap想象成一个以位为单位数组，数组中的每个单元只能存0或者1，数组的下标在Bitmap中叫做偏移量。使用Bitmap实现统计功能，更省空间。如果只需要统计数据的二值状态，例如商品有没有、用户在不在等，就可以使用 Bitmap，因为它只用一个 bit 位就能表示 0 或 1。

2、Hyperloglog：HyperLogLog 是一种用于统计基数的数据集合类型，HyperLogLog 的优点是，在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的。每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。场景：统计网页的UV（即Unique Visitor，不重复访客，一个人访问某个网站多次，但是还是只计算为一次）。

要注意，HyperLogLog 的统计规则是基于概率完成的，所以它给出的统计结果是有一定误差的，标准误算率是 0.81%。

3、Geospatial ：主要用于存储地理位置信息，并对存储的信息进行操作，适用场景如朋友的定位、附近的人、打车距离计算等。

Redis的跳跃表?

跳跃表是有序集合zset的底层实现之一

跳跃表支持平均O（logN）,最坏 O（N）复杂度的节点查找，还可以通过顺序性操作批量处理节点。

跳跃表实现由zskiplist和zskiplistNode两个结构组成，其中zskiplist用于保存跳跃表信息（如表头节点、表尾节点、长度），而zskiplistNode则用于表示跳跃表节点。

跳跃表就是在链表的基础上，增加多级索引提升查找效率。

李莲花*

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
@Redis--数据类型及使用场景

数据类型：数据类型指的是存储的数据的类型，也就是 value 部分的类型，key 部分永远都是字符串。Redis有五种常用数据类型：String、Hash、Set、List、SortedSet。以及三种特殊的数据类型：Bitmap、HyperLogLog、Geospatial ，其中HyperLogLog、Bitmap的底层都是 String 数据类型，Geospatial 的底层是 Sorted Set 数据类型
复制链接

扫一扫