Redis对象和五种常用数据类型

最新推荐文章于 2024-03-09 17:52:08 发布

程序员加文

最新推荐文章于 2024-03-09 17:52:08 发布

阅读量337

点赞数 2

分类专栏： Redis 文章标签： redis 数据库缓存

本文链接：https://blog.csdn.net/weixin_50799082/article/details/132316855

版权

Redis 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Redisobject 对象

对象分为键对象和值对象

键对象一般是string类型

值对象可以是string，list，set,zset,hash

q：redisobj的结构

typedef struct redisObject {  
    //类型  
    unsigned type:4;  
    //编码  
    unsigned encoding:4;  
    //指向底层实现数据结构的指针  
    void *ptr;  
    //引用计数，垃圾回收的时候使用
    int refcount;
    //最近被使用的时间，内存淘汰的时候用
     unsigned lru; 
} robj;

q:数据类型，编码和数据结构之间的对应关系？

在这里插入图片描述

Redis对象和数据结构的关系

键总是一个字符串对象
而值可以是五种中的一种

type 命令得到的结果就是值的类型

可以用object encoding命令查看编码

list数据类型的编码由linkedlist和ziplist编码合并成了quicklist编码

q: 通用数据类型命令

keys *  //查看当前库所有key    (匹配：keys *1)

exists key //判断某个key是否存在,如果键存在则返回1，不存在则返回0：

type key //查看你的key是什么类型

del key  //删除指定的key数据,del是一个通用命令，无论值是什么数据结构类型，del命令都可以将其 删除，返回结果为成功删除键的个数，假设删除一个不存在的键，就会返回 0

unlink key   //根据value选择非阻塞删除,仅将keys从keyspace元数据中删除，真正的删除会在后续异步操作。

expire key 10   //10秒钟：为给定的key设置过期时间

ttl key //查看还有多少秒过期，-1表示永不过期，-2表示已过期

select number //命令切换数据库

dbsize //查看当前数据库的key的数量

flushdb //清空当前库

flushall //通杀全部库

命令在执行前都会判断参数是否是自己可以接收，否则会返回错误

数据类型

string 字符串

q: 特点

其value是字符串，不过根据字符串的格式不同，又可以分为3类：

string：普通字符串
int：整数类型，可以做自增、自减操作
float：浮点类型，可以做自增、自减操作

q: 适用场景？

String 的常见应用场景如下：

常规数据（比如 session、token、序列化后的对象、图片的路径）的缓存；
计数比如用户单位时间的请求数（简单限流可以用到）、页面单位时间的访问数；
分布式锁(利用 SETNX key value 命令可以实现一个最简易的分布式锁)；

q:常用命令？

 set  <key> <value> //添加键值对
                                
 
 *NX：当数据库中key不存在时，可以将key-value添加数据库
 
 *XX：当数据库中key存在时，可以将key-value添加数据库，与NX参数互斥
 
 *EX：key的超时秒数
 
 *PX：key的超时毫秒数，与EX互斥
 
 
 get  <key> //查询对应键值
 
 append <key> <value> //将给定的<value> 追加到原值的末尾,返回长度
 
 strlen <key> //获得值的长度
 
 setnx <key> <value> //只有在 key 不存在时  设置 key 的值
 
 incr <key> //将 key 中储存的数字值增1  只能对数字值操作，如果为空，新增值为1
 
 decr <key> //将 key 中储存的数字值减1  只能对数字值操作，如果为空，新增值为-1
 
 incrby / decrby <key> <步长> //将 key 中储存的数字值增减。自定义步长。
 
 mset <key1><value1><key2><value2> ..... //同时设置一个或多个 key-value对 
 
 mget <key1><key2><key3> .....  //同时获取一个或多个 value 
 
 msetnx <key1><value1><key2><value2> .....  //同时设置一个或多个 key-value 对，当且仅当所有给定 key 都不存在。 原子性，有一个失败则都失败
 
 getrange <key><起始位置><结束位置>  //得值的范围，类似java中的substring，前包，后包
 
 setrange <key><起始位置><value>  //用 <value> 覆写<key>所储存的字符串值，从<起始位置>开始(索引从0开始)。
 
 setex <key><过期时间><value>  //设置键值的同时，设置过期时间，单位秒。
 
 getset <key><value> //以新换旧，设置了新值同时获得旧值。

q：底层编码方式和数据结构？

当存储的是long 数字的时候，使用int编码，prt直接存储数字

不包括浮点数

当存储的字符串小于44个字节的时候，使用embstr编码，字符串和redisobject存储在一起
当存储的字符串大于44个字节的时候，使用raw编码，prt存储的是sds的地址指针

set 集合

q: 特点

无序
元素不可重复
查找快
支持交集、并集、差集等功能

q: 适用场景？

应用场景：

需要存放的数据不能重复的场景
- 不可重复下单
- 点赞
需要获取多个数据源交集、并集和差集的场景
- 共同好友(交集)、共同粉丝(交集)、共同关注(交集)、好友推荐（差集）、音乐推荐（差集）、订阅号推荐（差集+交集）等场景。
需要随机获取数据源中的元素的场景
- 抽奖系统、随机点名等场景。
- 相关命令：SPOP（随机获取集合中的元素并移除，适合不允许重复中奖的场景）、SRANDMEMBER（随机获取集合中的元素，适合允许重复中奖的场景）。

q:常用命令？

sadd <key><value1><value2> .....  //将一个或多个 member 元素加入到集合 key 中，已经存在的 member 元素将被忽略

smembers <key>  //取出该集合的所有值。

sismember <key><value> //判断集合<key>是否为含有该<value>值，有1，没有0

scard<key> //返回该集合的元素个数。

srem <key><value1><value2> .... //删除集合中的某个元素。

spop <key> //随机从该集合中吐出一个值。

srandmember <key><n> //随机从该集合中取出n个值。不会从集合中删除 。

smove <source><destination>value //把集合中一个值从一个集合移动到另一个集合

sinter <key1><key2> //返回两个集合的交集元素。

sunion <key1><key2> //返回两个集合的并集元素。

sdiff <key1><key2> //返回两个集合的差集元素(key1中的，不包含key2中的)

q：底层编码方式和数据结构？

当存储的所有数据都是整数，元素数量不超过set-max-intset-entries时，Set会采用IntSet编码，以节省内存,底层数据结构是intset
当存储的所有数据不都是整数，或元素数量超过set-max-intset-entries时，set采用hashtable编码，底层是Dict中的key用来存储元素，value统一为null。

hash 哈希

q: 特点

hash也叫散列，是一个键值对集合。

q: 适用场景？

hash特别适合用于存储对象。

q:常用命令？

hset <key><field><value> <field2><value2>  //给<key>集合中的 <field>键赋值<value>

hget <key1><field> //从<key1>集合<field>取出 value

hmset <key1><field1><value1><field2><value2>... //批量设置hash的值,hmset被弃用，可以用hset做到

hexists<key1><field> //查看哈希表 key 中，给定域 field 是否存在。

hkeys <key> //列出该hash集合的所有field

hvals <key> //列出该hash集合的所有value

hincrby <key><field><increment> //为哈希表 key 中的域 field 的值加上增量 1  -1

hsetnx <key><field><value> //将哈希表 key 中的域 field 的值设置为 value ，当且仅当域 field 不存在 .

q：底层编码方式和数据结构？

Hash结构默认采用ZipList编码，用以节省内存。 ZipList中相邻的两个entry 分别保存field和value；底层数据结构式ziplist
当数据量较大时，Hash结构会转为hashtable编码，底层数据结构是Dict，触发条件有两个：
- ZipList中的元素数量超过了hash-max-ziplist-entries（默认512）
- ZipList中的任意entry大小超过了hash-max-ziplist-value（默认64字节）

节点过多，或单个节点过大

zset/sorted set 有序集合

q: 特点

无重复
有序

每个成员都关联了一个评分（score）,这个评分（score）被用来按照从最低分到最高分的方式排序集合中的成员。
集合的成员是唯一的，但是评分可以是重复了。

q: 适用场景？

适合范围或者排序的应用场景：

排行榜

q:常用命令？

zadd <key><score1><value1><score2><value2>… //将一个或多个 member 元素及其 score 值加入到有序集 key 当中。

zrange <key><start><stop> [WITHSCORES] //返回有序集 key 中，下标在<start><stop>之间的元素,带WITHSCORES，可以让分数一起和值返回到结果集。

zrangebyscore key minmax [withscores] [limit offset count] //返回有序集 key 中，所有 score 值介于 min 和 max 之间(包括等于 min 或 max )的成员。有序集成员按 score 值递增(从小到大)次序排列。 

zrevrangebyscore key maxmin [withscores] [limit offset count]        //同上，改为从大到小排列。 

zincrby <key><increment><value>  // 为元素的score加上增量

zrem <key><value> //删除该集合下，指定值的元素 

zcount <key><min><max> //统计该集合，分数区间内的元素个数 

zrank <key><value> //返回该值在集合中的排名，从0开始。

q：底层编码方式和数据结构？

当满足下面条件时，采用ziplist编码，底层数据结构是ziplist
- 元素数量小于zset_max_ziplist_entries，默认值128
- 每个元素都小于zset_max_ziplist_value字节，默认值64

ziplist本身没有排序功能，而且没有键值对的概念，因此需要有zset通过编码实现：
- ZipList是连续内存，因此score和element是紧挨在一起的两个entry， element在前，score在后
- score越小越接近队首，score越大越接近队尾，按照score值升序排列

否则采用zset编码，底层是zset数据结构，zset的数据结构又指向skiplist和dict

SkipList：可以排序，并且可以同时存储score和ele值（member）
Dict：可以键值存储，并且可以根据key找value,实现O(1)的查找

二者实际上共用对象，不会造成内存的浪费

list 列表

q: 特点

双向链表结构。既可以支持正向检索和也可以支持反向检索。

特征也与LinkedList类似：

单键多值
有序
元素可以重复
插入和删除快
查询速度一般

q: 适用场景？

应用场景:

常用来存储一个有序数据，例如：朋友圈点赞列表，评论列表等。
可以用来做消息队列，只是功能过于简单且存在很多缺陷，不建议这样做。

q:常用命令？

lpush/rpush <key><value1><value2><value3>  //.... 从左边/右边插入一个或多个值。lpush是头插法

lpop/rpop <key> //从左边/右边吐出一个值。值在键在，值光键亡。


rpoplpush <key1><key2>从<key1> //列表右边吐出一个值，插到<key2>列表左边。


lrange <key><start><stop> //按照索引下标获得元素(从左到右)

lrange <key> 0 -1  //0左边第一个，-1右边第一个，（0 -1表示获取所有）

lindex <key><index> //按照索引下标获得元素(从左到右)

llen <key> //获得列表长度 

linsert <key> before/after <value><newvalue> //在<value>的前面、后面插入<newvalue>插入值

lrem <key><n><value> //从左边删除n个value(从左到右)

lset<key><index><value> //将列表key下标为index的值替换成value

q：底层编码方式和数据结构？

List的编码方式是quicklist,底层数据结构为快速链表quickList，quicklist的节点又指向了ziplist

Redis 3.2 之前，List 底层实现是 LinkedList 或者 ZipList。 Redis 3.2 之后，引入了 LinkedList 和 ZipList 的结合 QuickList，List 的底层实现变为 QuickList。

首先在列表元素较少的情况下会使用一块连续的内存存储，这个结构是ziplist，也即是压缩列表。(它将所有的元素紧挨着一起存储，分配的是一块连续的内存。)

当数据量比较多的时候才会改成quicklist。

因为普通的链表需要的附加指针空间太大，会比较浪费空间。比如这个列表里存的只是int类型的数据，结构上还需要两个额外的指针prev和next。

Redis将链表和ziplist结合起来组成了quicklist。也就是将多个ziplist使用双向指针串起来使用。这样既满足了快速的插入删除性能，又不会出现太大的空间冗余。

数据结构

sds 简单动态字符串

q：sds的结构

sds的结构

struct sdshdr { 
//记录buf数组中已使用字节的数量 
//等于SDS所保存字符串的长度 
int len; 
//记录buf数组中未使用字节的数量
int free;
//字节数组，用于保存字符串
char buf[];
};

q: sds和c字符串的区别

相同点：

都是用char数组来记录字符，最后都有一个\0来代表字符串结束

sds最后也用\0代表结束，是为了重用c语言字符串的一些函数，例如printf打印，而不用重写所有的函数

不同点

肯定是c语言字符串存在一定的缺陷，redis才会重写，那么这些既是redis和c语言字符串的不同点，也是redis sds的优点

常数级别获取字符串长度，sds获取字符串长度的时间复杂度是O(1),c语言是O(n),通过len的冗余存储来实现
杜绝缓冲区溢出，字符串在拼接之前可以做内存检查，确保空间充足，否则进行扩充；不会像c语言一样造成内存溢出
减少修改字符串时带来的内存重分配次数，预分配空间free，来减少内存重分配的次数，可以提升性能
二进制安全，c语言字符串通过\0空字符来标志字符串结束，因此不能包含空字符；而sds通过len来表示字符串结束，可以包含空字符，可以存储图片等二进制信息，因此是二进制安全的

q: 容量扩充机制？

如图中所示，内部为当前字符串实际分配的空间capacity一般要高于实际字符串长度len。

当字符串长度小于1M时，扩容都是加倍现有的空间
如果超过1M，扩容时一次只会多扩1M的空间。需要注意的是字符串最大长度为512M。

intset 正数集合

q: intset的结构

typedef struct intset {  
    //编码方式  
    uint32_t encoding;  
    //集合包含的元素数量  
    uint32_t length;  
    //保存元素的数组  
    int8_t contents[];  
} intset;

数组升序排列
没有重复

q: 如何升级？

当新元素很大的时候，集合要升级成更大的编码方式
升级整数集合并添加新元素共分为三步进行：
1）根据新元素的类型，扩展整数集合底层数组的空间大小，并为新元素分配空间。
2）将底层数组现有的所有元素都转换成与新元素相同的类型，并将类型转换后的元素放置到正确的位上，而且在放置元素的过程中，需要继续维持底层数组的有序性质不变。
3）将新元素添加到底层数组里面。

❑升级操作为整数集合带来了操作上的灵活性，并且尽可能地节约了内存。
❑整数集合只支持升级操作，不支持降级操作。

dictht 哈希表

typedef struct dictht {  
    //哈希表数组  
    dictEntry **table;  
    //哈希表大小  
    unsigned long size;  
    //哈希表大小掩码，用于计算索引值  
    //总是等于size-1  
    unsigned long sizemask;  
    //该哈希表已有节点的数量  
    unsigned long used;  
} dictht;

哈希表结点

typedef struct dictEntry {  
    //键  
    void *key;  
    //值  
    union{  
        void *val;  
        uint64_tu64;  
        int64_ts64;  
    } v;  
    //指向下个哈希表节点，形成链表  
    struct dictEntry *next;  
} dictEntry;

q：如何解决哈希冲突？

用拉链法的头插法解决哈希冲突

dict 字典

typedef struct dict {  
    //类型特定函数  
    dictType *type;  
    //私有数据  
    void *privdata;  
    //哈希表  
    dictht ht[2];  
    // rehash索引  
    //当rehash不在进行时，值为-1  
    in trehashidx; /* rehashing not in progress if rehashidx == -1 */  
} dict;

ht有两个，一般只使用第一个，第二个哈希表只在rehash的时候用

插入数据的时候，先计算哈希值，再计算索引值，再插入到指定位置

q : 如何rehash？

随着操作的不断执行，哈希表保存的键值对会逐渐地增多或者减少，为了让哈希表的负载因子（load factor）维持在一个合理的范围之内，当哈希表保存的键值对数量太多或者太少时，程序需要对哈希表的大小进行相应的扩展或者收缩。

扩展和收缩哈希表的工作可以通过执行rehash（重新散列）操作来完成，Redis对字典的哈希表执行rehash的步骤如下：

1）为字典的ht[1]哈希表分配空间，这个哈希表的空间大小取决于要执行的操作，以及ht[0]当前包含的键值对数量（也即是ht[0].used属性的值）：
❑如果执行的是扩展操作，那么ht[1]的大小为第一个大于等于ht[0].used*2的2 n（2的n次方幂）；
❑如果执行的是收缩操作，那么ht[1]的大小为第一个大于等于ht[0].used的2 n。

2）将保存在ht[0]中的所有键值对rehash到ht[1]上面：rehash指的是重新计算键的哈希值和索引值，然后将键值对放置到ht[1]哈希表的指定位置上。

3）当ht[0]包含的所有键值对都迁移到了ht[1]之后（ht[0]变为空表），释放ht[0]，将ht[1]设置为ht[0]，并在ht[1]新创建一个空白哈希表，为下一次rehash做准备。

为ht[1]分配空间，复制ht[0]的数据到ht[1],释放ht[0],把ht[1]设为ht[0],ht[1]创建一个空哈希表

q:什么时候rehash

哈希表的扩展与收缩
哈希表的扩展与收缩当以下条件中的任意一个被满足时，程序会自动开始对哈希表执行扩展操作：
1）服务器目前没有在执行BGSAVE命令或者BGREWRITEAOF命令，并且哈希表的负载因子大于等于1。
2）服务器目前正在执行BGSAVE命令或者BGREWRITEAOF命令，并且哈希表的负载因子大于等于5。

为什么rehash是渐进式？

如果ht[0]的数据非常多，那么把数据全部转移到ht[1]将会非常耗费时间，因此这个过程是分多次，渐进式完成的
rehashidx记录了正在转移的索引下标，当转移完成，会置为-1

因为在进行渐进式rehash的过程中，字典会同时使用ht[0]和ht[1]两个哈希表，所以在渐进式rehash进行期间，字典的删除（delete）、查找（find）、更新（update）等操作会在两个哈希表上进行。例如，要在字典里面查找一个键的话，程序会先在ht[0]里面进行查找，如果没找到的话，就会继续到ht[1]里面进行查找，诸如此类。

另外，在渐进式rehash执行期间，新添加到字典的键值对一律会被保存到ht[1]里面，而ht[0]则不再进行任何添加操作，这一措施保证了ht[0]包含的键值对数量会只减不增，并随着rehash操作的执行而最终变成空表。

ziplist 压缩列表

q: ziplist的结构？

每个压缩列表节点可以保存一个字节数组或者一个整数值

q: ziplist过大的时候有什么缺点？

当ziplist变得很⼤的时候，它有如下几个缺点：

每次插⼊或修改引发的realloc操作会有更⼤的概率造成内存拷贝，从而降低性能。
⼀旦发生内存拷贝，内存拷贝的成本也相应增加，因为要拷贝更⼤的⼀块数据。
当ziplist数据项过多的时候，在它上⾯查找指定的数据项就会性能变得很低，因为ziplist上的查找需要进行遍历。

skiplist 跳表

skiplist是多层级不同跨度的链表

q: skiplist的结构？

zsikpList

typedef struct zskiplist {  
    //表头节点和表尾节点  
    structz skiplistNode *header, *tail;  
    //表中节点的数量  
    unsigned long length;  
    //表中层数最大的节点的层数  
    int level;  
} zskiplist;

zskipListNode

typedef struct zskiplistNode {  
    //层  
    struct zskiplistLevel {  
        //前进指针  
        struct zskiplistNode *forward;  
        //跨度  
        unsigned int span;  
    } level[];  
    //后退指针  
    struct zskiplistNode *backward;  
    //分值  
    double score;  
    //成员对象  
    robj *obj;  
} zskiplistNode;

每个结点的成员对象是唯一的，但是分值可以相同，分值相同就按照成员对象由小到大排序，整个链表都是按照分值由小到大排序

q: skiplist如何遍历？

遍历：
首先遍历高层级跨度大的指针，如果过大，就遍历下一层级

zset

q:zset的结构？

typedef struct zset {  
    zskiplist *zsl;  
    dict *dict;  
} zset;

SkipList：可以排序，并且可以同时存储score和ele值（member）
Dict：可以键值存储，并且可以根据key找value,实现O(1)的查找

二者实际上共用对象，不会造成内存的浪费

quicklist 快表

q:quicklist的结构

quicklist 实际上是 zipList 和 linkedList 的混合体，它将 linkedList 按段切分，每一段使用 zipList 来紧凑存储，多个 zipList 之间使用双向指针串接起来。

typedef struct quicklist {  
    quicklistNode *head;  
    quicklistNode *tail;  
    unsigned long count;        /* total count of all entries in all ziplists */  
    unsigned long len;           
} quicklist;

typedef struct quicklistNode {  
    struct quicklistNode *prev; //上一个node节点  
    struct quicklistNode *next; //下一个node  
    unsigned char *zl;            //保存的数据 压缩前ziplist 压缩后压缩的数据  
    unsigned int sz;             /* ziplist size in bytes */  
    unsigned int count : 16;     /* count of items in ziplist */  

} quicklistNode;