尽管都知道C语言字符串末尾是以'\0'结尾,但是在使用上还是遇到了这样的问题
假设我的字符串结构体如下所示
typedef struct {
char *ch; // 指向字符数组
int length; // 字符串的实际长度
int capacity; // 分配的内存容量(包含终结符)
} String;
然后我有一个字符串匹配算法,算法也不是关键,不过这里也粘出来吧
int IndexStupid(String *str1, String *str2, int pos) {
if (str1 == NULL || str2 == NULL || str1->ch == NULL || str2->ch == NULL) {
return -1;
}
if (pos < 0 || pos >= str1->length) {
return -1;
}
int i = pos; // 主串当前位置下标
int j = 0; // 子串当前位置下标
while (i < str1->length && j < str2->length) {
if (str1->ch[i] == str2->ch[j]) {
// 当前字符匹配
i++;
j++;
} else {
// 不匹配则进行回溯
i = i - j + 1; // 主串回溯到下一个位置
j = 0; // 子串从头开始
}
}
if (j == str2->length) {
return i - j; // 子串遍历完成,返回匹配的位置
} else {
return -1; // 未找到匹配
}
}
写完匹配算法,突然对pos >= str1->length的等于产生了疑问:因为我这里默认将字符串结尾'\0'算作最后一位,pos等于str1->length会怎么样,就是想着匹配'\0'。于是,我写出了如下的代码
#include "String.h"
int main(){
String s = {.ch = strdup("Hello World!"), .length = 12};
String s2 = {.ch = strdup("\0"), .length = 1};
printf("%d\n", IndexStupid(&s,&s2,12));
return 0;
}
但是输出结果却是-1
没找到我就开始怀疑'\0'的问题了(但其实是我太在意\0了,但是函数也没对它做特殊处理),于是我开始了这样的疑惑,难道经过strdup去掉了末尾\0的操作?怀着如此疑问,进行了这样的打印:
printf("%s\n",s.ch[12]);
printf("%d\n",s.ch[12]);
printf("%s\n","\0");
printf("%s\n","");
printf("%d\n",'\0');
打印的结果是相同的,因为printf默认以\0为结束标志
让我们逐一分析这些 printf
调用。
1、
printf("%s\n",s.ch[12]);
这个调用有问题。s.ch[12]
取的是字符串 "Hello World!"
后的一个字符,即字符串的 null 终止符(因为在 C 语言中,字符串索引从 0 开始)。%s
需要一个 char *
类型的参数(即字符串的起始地址),但是传入了一个 char
类型的参数(即字符串的一个字符)。这是类型不匹配,行为是未定义的(UB),可能会导致程序崩溃。正确的做法应该是传递字符串的地址:
printf("%s\n", &s.ch[12]);
然后,这将会打印一个空字符串,因为 s.ch[12]
是一个 null 字符,代表字符串的结束。
2、
printf("%d\n",s.ch[12]);
这个调用是正确的。这将打印 s.ch[12]
的整数值,即 0
,因为 s.ch[12]
是字符串 "Hello World!"
的 null 终止符。
3、
printf("%s\n","\0");
"\0"
是一个包含单个 null 字符的字符串。%s
将会试图打印以此为起始的字符串,但由于它立即遇到了字符串的结束符,所以什么也不会打印出来。
4、
printf("%s\n","");
""
是一个空字符串,其唯一的字符就是 null 字符。同样,%s
会尝试打印,但由于马上就遇到了字符串的结束符,所以什么也不会打印出来。
5、
printf("%d\n",'\0');
'\0'
是一个 null 字符的字符字面量。它的整数值是 0
,所以这个调用会打印 0
。
总的来说,输出大致应该如下:
(可能是垃圾值或程序崩溃) 0 (空行) (空行) 0
从这里可能就对'\0'有了进一步更清晰的认识