c语言实现动态字符串,用C语言写个动态字符串

在所有的文本处理程序里,动态字符串是必备的基础模块。

(编译器也是一个大号的文本处理程序。它的功能就是把类似人类语言的源代码,转化成机器语言。)

代码是字符串,人类语言是字符串,人类的语音也是“字符串”,区别是它们各自的字符集不一样,字符串的比较函数也不一样。

代码,一般是由关键字、数字、运算符、下划线和英文字母组成的序列。

人类语言,不同的语言有不同的字符,写成文章之后也是字符组成的序列。

语音,录下来之后也是采样点组成的序列。采样点的范围就是它的“字符集”。

(当然,语音的比较是比较难的,属于专门的学科:自然语言处理,NLP。)

不管是代码还是文章,在实际应用时它的大小都是不固定的,也就要求处理它的程序里必须具有处理动态字符串的模块。

C++是有string字符串类的(大多数语言都有),但是C语言的字符串就比较粗糙。

不记录长度的做法导致strlen()函数的效率低下,而且strcpy()和strcat()函数还隐藏着缓冲区溢出的风险,所以各种开源软件都自己实现一个动态字符串。

这里咱也给它实现一个:

8021b64d4c2a559f49fa9e1df98e08df.png

数据结构和函数的定义如上图。

capacity表示容量,len表示长度,容量减去长度就是剩余的可用空间。

如果有剩余空间,在strcat()时就不必分配内存,可以尽量减少realloc的次数。

scf_string_alloc()相当于默认的无参构造。

scf_string_clone()相当于拷贝构造。

scf_string_free()相当于析构。

scf_string_cmp()相当于operator==()的重载函数。

scf_string_copy()相当于operator=()的重载函数,即拷贝赋值。

scf_string_cat()相当于operator+=()的重载函数,它与构造函数都有3个,其中2个用于支持C风格的字符串,用于连接字符串。

scf_string_cstr_len(),在调用者知道字符串长度的时候,可以节省一次strlen()的调用。

另外可以用在非0结尾的字符串上,例如在HTTP协议头里,根据结尾的\r\n拆分每一行。

从一大串HTTP头里查找"\r\n",可以使用KMP算法,见之前的文章:

字符串匹配的KMP算法

接下来的几张图,是具体的代码实现。

设置的每次申请内存时,额外增加4个字节。

c64e65e47612dc6e98c1efae37514660.png

a3df604d2b8a77fd95c5d10008f3f360.png

f4893aac8070278e4e9dc244c4a02067.png

5b3a8d873180967df8a1ae971067aed5.png

fd51ff1b7730d0947108396b54c57dbd.png

使用最多的是最后这3个字符串连接函数,在编译器的词法分析时,一个词的字符是随着分析过程逐渐连接上去的。

264471ab461d3676ad5df829852e00be.png

想了解更多精彩内容,快来关注闲聊代码

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值