聊聊Redis字符串与C字符串的区别

一、数据结构
redis的字符串底层数据结构是sds(simple dynamic string),即简单动态字符串,其结构体定义如下:

struct sdshdr {
    // buf 中已占用空间的长度
    int len;

    // buf 中剩余可用空间的长度
    int free;

    // 数据空间
    char buf[];
};

其中:
len:当前实际存储的字符串长度
free:剩余未使用的长度
buf:用于存储数据的字节数组

SDS遵循C语言字符串以空字符结尾的惯例,保存空字符的1字节空间不计算在sds的len属性中,并且为空字符分配额外的1字节空间,以及添加空字符到字符串末尾等操作,都有SDS函数自动完成。

二、复杂度问题
SDS由于存储了len属性,所以获取字符长度的时间复杂度为O(1),而C字符串并不记录本身长度,故获取字符串长度需要遍历整个字符串,直到遇到空字符,时间复杂度为O(N)。SDS的长度更新是有SDS的API自动完成。
SDS的设计是典型的利用空间换时间。

三、内存分配释放策略
概括为预分配+惰性释放

SDS的内存分配策略:
1 如果对SDS字符串修改后,len的值小于1MB,那么程序会分配和len同样大小的空间,此时len和free的值是相同的,例如,如果SDS的字符串长度修改为15字节,那么会分配15字节空间给free,SDS的buf属性长度为15(len)+15(free)+1(空字符) = 31字节。
2 如果SDS字符串修改后,len大于等于1MB,那么程序会分配1MB的空间给free,例如,SDS字符串长度修改为50MB那么程序会分配1MB的未使用空间给free,SDS的buf属性长度为50MB(len)+1MB(free)+1byte(空字符)。
预分配策略有效减少了内存充分配操作次数。

SDS的内存释放策略:
当需要缩短SDS字符串时,程序并不立刻将内存释放,而是使用free属性将这些空间记录下来,以备将来使用。

三、缓冲区溢出问题
SDS的字符串的内存预分配策略能有效避免缓冲区溢出问题,
C字符串每次操作增加长度时,都要分配足够长度的内存空间,否则就会产生缓冲区溢出(buffer overflow)。

四、二进制安全问题
SDS字符串API都是以处理二进制的方式处理buf数组里的数据,程序不会对其中的数据进行过滤、操作等,所以SDS是二进制数据安全的。
C字符串的字符则必须符合某种编码(ASCII),并且字符串的中间不能包含空字符,否则字符串就会被截断,所以C字符串智能保存文本数据,而不能保存图片、音视频等数据类型。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值