【Redis数据结构篇】- SDS

前言

Redis虽然是使用C语言编写的,但是并没有使用C语言的字符串,而是自己实现了一个新的数据结构来表示字符串,即简单动态字符串(Simple Dynamic String)SDS.

一. 数据结构

SDS 的数据结构有两个版本,在3.2版本前,数据结构如下,

typedef char *sds;      //注意,sds其实不是一个结构体类型,而是被typedef的char*,好处见下文
struct sdshdr {
    unsigned int len;   //buf中已经使用的长度
    unsigned int free;  //buf中未使用的长度
    char buf[];         //柔性数组buf
};

3.2版本之后,针对不同的长度范围定义了不同的结构,数据结构如下,

typedef char *sds;      

struct __attribute__ ((__packed__)) sdshdr5 {     // 对应的字符串长度小于 1<<5
    unsigned char flags; /* 3 lsb of type, and 5 msb of string length */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr8 {     // 对应的字符串长度小于 1<<8
    uint8_t len; /* used */                       //目前字符创的长度
    uint8_t alloc;                                //已经分配的总长度
    unsigned char flags;                          //flag用3bit来标明类型,类型后续解释,其余5bit目前没有使用
    char buf[];                                   //柔性数组,以'\0'结尾
};
struct __attribute__ ((__packed__)) sdshdr16 {    // 对应的字符串长度小于 1<<16
    uint16_t len; /* used */
    uint16_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {    // 对应的字符串长度小于 1<<32
    uint32_t len; /* used */
    uint32_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {    // 对应的字符串长度小于 1<<64
    uint64_t len; /* used */
    uint64_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};

新版带来的好处就是:对内存做了进一步优化,长度不同的字符串使用不同的数据结构,选取不同的数据类型uint8_t或者uint16_t或者uint32_t等来表示长度、一共申请字节的大小等。上面结构体中的__attribute__ ((packed)) 设置是告诉编译器取消字节对齐,则结构体的大小就是按照结构体成员实际大小相加得到的。

二 . 特点

2.1 二进制安全

C语言,使用char数组来保存字符创,且必须以空字符’\0’结尾来标志结束,同时因为字符串不记录字符串长度,所以想要获取字符串的长度,只能遍历char数组直到遇到’\0’,时间复杂度为O(n);
因为C字符串必须以空字符’\0’识别结尾,所以只能保存文本数据,不能用来保存多媒体,图片等二进制数据,即是二进制不安全的。
而SDS存在len属性来记录字符串长度,此时获取字符串长度时间复杂度变为了O(1)。同时因为记录了长度,不需要以’\0’来标志结束,所以可以保存多媒体、图片等二进制数据,即是二进制安全的。
但需要注意的是,SDS仍会以空白字符’\0’结尾(不占用长度),不过只是为了复用C字符串的一些函数。

2.2 内存空间分配

C语言字符串,空间需要手动分配,扩充字符串的时候如果没分配足够的内存,则在字符串拼接时可能会出现缓冲区溢出,数据覆盖的问题。在缩短字符串时,若未及时回收空间,也会存在空间泄漏的问题。

空间预分配

而SDS则不会出现这种情况,当字符串需要扩充时,SDS会自动扩容,不需要手动管理,同时还会分配额外未使用的空间。扩容策略如下:

  • 若扩大长度之后的长度(len)小于1M时,则扩容为加倍当前空间,分配和len属性一样大小的未使用空间(此时buf数组已使用空间=未使用空间)。
  • 若扩大长度之后的长度(len)大于1M,扩容一次会多扩容1M的空间
    而由于每次扩容会多出一片空间(一般alloc会大于len),从而不用每次扩充字符串时都需要重新分配内存,减少了内存重分配的次数,提升了效率。

惰性回收

  • 字符串缩短时,程序不立即回收多出来的字节,以备后来使用(扩充字符串)
  • SDS提供了释放空间的api,在有需要时,可以释放内存,避免空间浪费

2.3 总结与C字符串的区别:

C字符串SDS
不记录长度,获取长度时间复杂度O(n)len记录长度,获取长度时间复杂度O(1)
可以保存不含’\0’的文本数据可以保存文本、图片、音频等多种二进制数据
扩充字符串会出现缓冲区溢出的问题不会出现缓冲区溢出的问题
修改字符串必然内存重分配修改字符串不一定触发内存重分配(次数变少)
可以使用C字符串所有函数可以使用部分C字符串函数

Redis定位于一个高性能的内存数据库,其面向的就是大数据量,大并发,频繁读写,高响应速度的业务。因此在保证安全稳定的情况下,性能的提升非常重要。而SDS的数据结构,屏蔽了C语言字符串的一些缺点,同时可以提供安全高性能的字符串操作。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SDS(简单动态字符串)是Redis底层数据结构之一。它采用一段连续的内存空间来存储字符串,并具有一定的灵活性和扩展性。下面是一个展示SDS数据结构的例子: ``` typedef struct sdshdr { int len; // 已占用空间的长度 int free; // 剩余可用空间的长度 char buf[]; // 字符数组 } sdshdr; ``` 在这个例子中,我们可以看到SDS结构包含了`len`表示已占用空间的长度,`free`表示剩余可用空间的长度,以及`buf[]`表示字符数组。举一个实际的例子,如果我们要存储字符串"Redis",SDS会为其分配5字节的已使用长度,并为其分配5字节的可用空间长度。 与C字符串相比,SDS具有一些区别。C字符串的长度需要通过遍历整个字符串才能获得,而SDS可以直接通过`len`属性来获取字符串的长度。此外,C字符串是以空字符'\0'作为字符串的结束标志,而SDS通过`len`属性来确定字符串的长度,不依赖空字符。 在Redis中,C字符串主要应用在不需要对字符串值进行修改的地方,比如打印日志。而SDS主要应用在需要修改字符串值的地方,比如Redis的数据库中,包含字符串值的键值对在底层都是使用SDS来实现的。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Redis底层数据结构——SDS](https://blog.csdn.net/weixin_39939725/article/details/110912176)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值