一、简单动态字符串(sds)
1. SDS数据结构的定义
struct sdshdr { //记录buf数组,已经使用的直接数量 int len; //记录buf数组中未使用的字节数量 int free; //字节数组 char buf[]; }
2. SDS与C字符串的区别
1. 常数复杂度获取字符串长度
c语言中的字符串并不记录自身的长度信息,获取长度操作的复杂度为O(n),而SDS结构中,维护了 len 字段,获取长度的复杂度为O(1);
2. 避免缓存区溢出
C字符串不记录自身长度,带来的另一个问题为,容易造成缓存区溢出;
当为其分配的空间无法容纳所有内容,就会造成缓存区溢出;
SDS的空间分配策略完全杜绝了缓存区溢出的可能;每次通过api对SDS进行修改时,都会检测sds的空间是否满足修改所需的要求,如果不满足,则会将sds的空间大小修改为满足修改所需的大小;( 2 * N或者N + 1MB 其中N:修改所需的大小 。 空间预分配机制)
3. 减少修改字符串时带来的内存重分配次数
redis作为一个数据库,常被作用于速度要求苛刻,频繁修改的场合,因此,减少内存重分配次数是很有必要的;
C字符串每次的空间都是N+1个字符串的数组(额外的一个存储空字符'\0')
3. 空间预分配
当SDS的APi对一个SDS进行修改时,并且需要对空间进行扩展时,程序不仅会对SDS分配需要的内存,还会分配额外的未使用空间,并通过len和free属性维护空间的使用情况
公式如下:
- 当修改后,SDS的长度(即len属性的值) 将小于1MB,那么程序会为sds分配和len属性同样大小的未使用空间;
- 如果大于等于1MB时,那么程序会分配1MB的未使用空间;
4. 惰性空间释放
惰性空间释放用于优化SDS字符串缩短操作,当SDS的API需要缩短SDS保存的字符串时,程序并不会字节使用内存重分配来回收多出来的字节空间,而是更新free字段,并为将来可能有的增长操作提供了优化;
这样,也能够一定程度上减少内存重分配的次数,提高程序的效率;
同时,SDS也提供了相应的API,在真正有需要的时候,真正的释放SDS的未使用空间,所以不用担心惰性空间释放策略会造成内存浪费;
5. 二进制安全
C字符串必须符合某种编码,以及使用空字符结尾,因此,只能保存文本数据,而不能保存二进制数据(二进制数据也许在非结尾也存在大量的空字符)
SDS解决了这个问题,APi采用了处理二进制的方式处理;
6. 兼容部分C字符串函数
SDS同样使用了空字符作为结尾标识,因此也兼容了部分C字符串函数
7. 小结
比起C字符串,SDS有以下优点
- 常数复杂度获取字符串长度
- 杜绝缓存区溢出
- 减少修改字符串长度所需的内存重分配次数
- 二进制安全
- 兼容部分C字符串函数