Redis的字符串的底层实现SDS

前言

Redis是使用C语言开发的,C语言又自己字符类型,但是Redis却没有直接使用C语言传统的字符串表示(以空字符串结尾的字符数组),而是自己构建了一种名为简单动态字符串(simple dynamic string,SDS)的抽象类型,并将SDS用作Redis 的默认字符串表示。

举个例子就是,如果客户端执行如下命令:

实际上在Redis内部创建了两个SDS,一个是名为“msg”的key的SDS,另一个是名为“hello world”的SDS。

SDS的定义

如果去查看源码,一个SDS的数据结构如下

struct sdshdr {
    // 记录buf数组中已使用字节的数量,等于SDS所保存字符串长度
    int len;
    // 记录buf数组中未使用字节数量
    int free;
    // 字节数组,用户保存字符串
    char buf[]
};

SDS相比C字符串的优势

常数复杂度获取字符串长度

学过C语言的都知道,在C语言中我们如果想获取一个字符串的长度,只有从头到尾的进行一波遍历,直到出现空字符串就停止,以此来统计字符串的长度,这种方式的时间复杂度是O(n)。

我们通过观察Redis中SDS的结构就发现了,它自己本身就保存了长度信息,所以我们要获取长度的话,他的时间复杂度就是O(1)。

杜绝缓冲区溢出

在C语言中,如果你想要拼接字符串时,它总是假定你已经分配好了足够的内存,但是一旦假定不成立,那么就会产生缓冲区溢出。

原本在程序内存中有两个紧邻着的C字符串s1和s2,s1保存了字符串“Redis”,s2保存了字符串“MongoDB”,如下图。

如果程序执行了语句,将s1的内存修改为“Redis Cluster”,但是在执行之前没有为s1分配足够的内存空间,那么在执行完只有,s1的数据就将溢出到s2所在的空间中,导致s2的内容被恶意的修改。

我们可以看出s1修改的内容最终落在了字符串s2的位置上了。

而在Redis中的SDS实际上就是对操作API进行封装,当调用API对SDS进行修改时,首先检查空间是否满足修改需求,如果不满足的话,API会自动将SDS的空间自动扩展至合适大小,然后再执行实际的修改操作。

减少修改字符串时带来的内存重新分配次数

Redis是一个高速缓存的数据库,性能就是他的命。同时经常要对字符串进行频繁的拼接和截断的操作,但是内存分配又是一个比较耗时的操作,如果每次修改字符串的长度都需要执行一次内存重新分配的话,可能还会对性能造成影响。

  1. 空间预分配

空间预分配用于优化SDS的字符串增长操作:当SDS的API对一个SDS进行修改。并且需要对SDS进行空间扩展的时候,程序不仅会为SDS分配修改所必须的空间,还会为SDS分配额外的未使用空间free,这样就避免了连续执行字符串添加带来的性能消耗。

惰性空间释放

每次分配都会分配多余的空间,那么会不会造成内存泄露或者浪费?所以还需要考虑内存释放问题。

Redis中采用了惰性空间释放用于优化SDS的字符串缩短操作:当SDS的API需要缩短字符串时,程序并不会立即使用内存重新来回收缩短后多出来的字节,而是使用free属性将这些字节数据记录起来,并等待将来使用。

二进制安全

在C语言中,判断一个字符串是否到达末尾就是检测是否出现了空字符串‘\0’。但是有很多数据结构很经常穿插空字符串在中间,比如图片,音频,视频,压缩文件的二进制数据。

而Redis就没有这种问题了,因为他自身的SDS结构中就已经保存了字符串的长度,所以我们不在需要依据‘\0’作为字符串的结尾,直接使用len就好了

### 回答1: Redis 字符串Redis 中最基本的数据类型。它是一种键值对存储方式,键是字符串类型,值也是字符串类型。 Redis 字符串底层实现是基于双向链表和字典(dictionary)的。在 Redis 中,所有的键值对都存储在一个字典中,字典中的每一个节点都是一个键值对,同时也是一个双向链表的节点。字典本身是一个哈希表,用于快速查找和插入键值对。 当 Redis 中的一个字符串被修改时,Redis 会将旧的字符串值从字典中删除,然后将新的字符串值插入到字典中。这样,就可以保证 Redis 字符串的原子性,同时也保证了字符串的高效存储。 总结一下,Redis 字符串底层原理就是基于字典和双向链表实现的键值对存储方式。 ### 回答2: Redis 字符串底层实现原理是基于简单动态字符串SDS)和字典(dict)。 简单动态字符串SDS)是 Redis 底层字符串实现,它是一个动态分配的字符数组,并且可以在 O(1) 复杂度下进行字符串长度的获取和修改。SDS 的结构体中包含字符串指针、字符串长度、已分配内存长度等字段,通过这些字段可以方便地对字符串进行操作。 字典(dict)是 Redis 底层用于存储字符串键值对的数据结构。在 Redis 字符串中,键相当于字符串的名字,值则是存储的实际数据。字典采用哈希表作为底层实现,使用哈希函数将键映射到哈希桶中,以提高查找效率。在 Redis 中,哈希表的长度会根据实际数据的增加和删除进行动态扩容和缩容,以保证哈希表的平均负载因子不超过一个特定的值。 Redis 字符串底层实现成为一个 SDS 字符串结构,它与字典结构之间是相互独立的。当一个字符串被确定为一个键或值时,它会被存储在一个 SDSDICT 字典中,其中键为字符串本身,值则是一个指向 SDS 结构的指针。 总结来说,Redis 字符串底层实现原理是基于简单动态字符串SDS)和字典(dict)。SDS 是一个动态分配的字符数组,可以方便地进行字符串长度的获取和修改。而字典用于存储字符串键值对,通过哈希表提高查找效率。在 Redis 中,字符串被存储在一个 SDSDICT 字典中,其中键为字符串本身,值为指向 SDS 结构的指针。 ### 回答3: Redis字符串底层原理是通过使用简单动态字符串(简称SDS实现的。SDSRedis自己实现的以C字符串结构为基础的字符串库,它解决了C字符串的一些限制,使得Redis可以支持更多的操作和功能。 在Redis中,每个字符串对象都由一个redisObject结构表示,该结构包含了一个指向SDS的指针和其他元数据。SDS结构由以下几部分组成: 1. len:记录字符串的长度,即字节数。 2. free:记录SDS结尾未使用的字节数,方便扩展字符串时无需重新分配内存。 3. buf:实际的字符数组,用于存储字符串的内容。 Redis字符串对象的底层原理有以下几个特点: 1. 动态扩展:SDS提供了高效的内存扩展机制,当字符串长度增加时,可以动态调整内存大小,避免了频繁的内存重新分配操作,提高了性能。 2. O(1)时间复杂度:SDS支持通过偏移量来直接访问字符串的某一位置的字符,所以读取和修改字符串的某一位置的操作时间复杂度为O(1)。 3. 惰性空间释放:当从字符串中删除部分字符时,SDS并不立即释放所占用的内存,而是通过将free字段增加相应的值来标记该内存已被释放,以备将来再次使用。 4. 兼容C字符串SDS结构与C字符串之间可以相互转换,方便Redis与其他系统进行兼容。 总的来说,Redis字符串底层原理是通过使用SDS实现的,SDS提供了高效的内存扩展和访问机制,使得Redis可以高效地处理字符串操作,提高了性能和灵活性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值