Redis系列(一)基础数据结构概述
前言
Redis是互联网领域使用最为广泛的存储中间件,它是“Remote Dictionary Service”(远程字典服务)的首字母缩写。Redis以其超高的性能、完美的文档和丰富的客户端库支持在开源中间件领域广受好评。本文主要介绍Redis中的基础数据结构。
一、基础数据类型
Redis具有5种数据结构,分别是:string(字符串)、list(列表)、hash(字典)、set(集合)和zset(有序集合)。这5种数据结构基本满足日常开发需求,结合不同的业务需求可以选用适合的数据结构进行开发实现。
二、概述
string(字符串)
字符串string是Redis中最简单的数据结构,它的内部结构是一个一维字符数组。
Redis中所有的数据结构均是以唯一的字符串key值作为名称,然后通过这个唯一的key获取相应的value数据。不同的数据结构差异就在于value的数据结构不一样。
字符串也是日常开发中最常用的数据结构,其中常见的用途就是缓存用户个人/登录信息。用法就是将用户对象进行JSON序列化,转换为字符串,然后将转换后的字符串放入Redis缓存中。同样的,在获取用户缓存信息时,需要进行反序列化。
Redis的字符串是动态字符串,所以是可以手动修改字符串,内部数据结构的实现类似于ArrayList,采用预分配冗余空间的方式来减少扩容时的内存重新分配次数。
总内存一般都是会大于实际的使用内存。当字符串长度小于1MB时,扩容都是加倍现有空间。如果长度大于1MB,之后的每次扩容只会增加1MB的空间。注意:字符串最大长度为512MB。
在存储时,如果value值是一个整数,还可以对它进行自增操作。自增是由范围的,范围在signed long的最大值和最小值之间。
list(列表)
Redis的列表相当于LinkedList,是一个双向链表的结构。这就意味着list的插入和删除非常快,但是索引查找会很慢。
当list弹出最后一个元素之后,该数据结构被自动删除,内存被回收。
可以用Redis提供的方法和list数据结构来实现队列和栈的特性。
list也经常被用作异步队列来使用。
hash(字典)
Redis中的字典hash相当于HashMap,也可以说是一个简单对象,它是一个无序的、内部存储着很多键值对的字典。内部实现上也和HashMap一致,都是“数组+链表”的二维结构,发生hash碰撞时,将元素使用链表进行连接。
与HashMap不同的是,Redis的字典value值只能是字符串。另外它们的rehash方式也不同,这是因为HashMap在数据量很大时,rehash将会变得很耗时,需要将所有数据一次性rehash。Redis为提高性能,不阻塞服务,采用了渐进式rehash的策略。
渐进式rehash是在rehash的同时,保留新旧两个hash字典结构,查询会同时查询两个字典,然后在后续的定时任务和hash操作指令中,循序渐进地将原hash内容迁移至新hash结构中。最终只会保留新的hash结构。
hash在移除最后一个元素后,该数据结构被自动删除,内存被回收。
hash也可以存储对象数据,如用户信息,在查询用户信息的某个字段值时,性能优于字符串的序列化存储,但是hash结构的内存消耗在存储同样数据时要高于单个字符串。
set(集合)
Redis的集合相当于HashSet,它的内部键值对时无序的、唯一的。它的内部实现相当于一个特殊的字典,字典中的所有value都是一个NULL值。
当集合中最后一个元素被移除后,数据结构将会被删除,内存被回收。
set结构可以用来存储在某个活动中中将的用户ID,因为有去重功能,可以保证同一个用户不会中将两次。
zset(有序集合)
zset时Redis提供的具有特色的数据结构,它类似于SortedSet和HashMap的结合体,一方面它是一个set,保证数据的唯一性,另一方面它可以给每个value赋予一个score值,代表这个value的排序权重。
zset的内部实现用的时一种叫做“跳跃列表”的数据结构。
上图为跳跃列表结构,元素1上存在有3个指针指向下一个元素,其中L3跳跃度最大,这样做的好处是经过一次指针下移,可以排除尽量多的不满足条件的元素。如查找元素6,经过L3(1–>4)指针,判断 6>4,下移指针 L3(4–>7),判断6<7,指针降级至 L2,由 L2 (7–>5),判断 6>5,再次指针降级至 L1,由 L1(5–>6)而找到目标,共经历4次指针下移,优于直接走 L1的5次。此方式在数据量大时优势更加明显。
zset中最后一个value值被移除后,数据结构被自动删除,内存被回收。
总结
list、set、hash、zset这四种数据结构都是容器类型,它们共享以下规则:
- create if not exists:如果容器不存在,那就自动创建一个,在进行操作。
- drop if no elements:如果容器没有元素了,则立刻删除容器,并释放对应内存。
Redis中所有数据结构均可设置过期时间,时间到了,Redis会自动删除对应的对象并释放内存。过期是以对象为单位的,如hash结构的过期是整个hash对象的,而不是某个key的。
注意:如果一个字符串已经设置了过期时间,然后进行了重新的set修改,它的过期时间将会消失。