写这篇文章,其实就是复习字符串和数组的差异吧,以及strlen和sizeof的用法,一不注意,还是有很多坑的
差异
strlen 是标准库函数,一般用于计算字符串的长度,运行时计算
sizeof是关键字,用于计算类型的大小,编译时计算
const char* str = "abcd3";
strlen(str) // 5 字符串的长度,5个字符
sizeof(str) // 4或8 即指针的大小 == sizeof(char*)
C/C++对字符串的约定
如果我们将一个字符串赋值给const char* 或者char []或者char*时,编译期会在末尾加上空字符'\0'来表示字符串的中止.
const char* ptr = "abc"; 在内存中实际是a b c \0
char ptr[] = "abc"; 同上会有空字符
char* ptr = "abc" 不推荐这么做,abc是常量字符串,不同的编译期可能会报错.
这么做的目的是什么了?
因为一些函数,比如strlen,strcmp,printf等遇到\0才会结束 .空字符不计入长度或输出
常量字符串 : const char*
常量字符串会以空字符'\0'表示结束.
对于strlen这个函数,已经知道它是计算长度,那么,他是怎么获取长度了 ?
其实,它是一直计算长度,直到遇到'\0'这个字符,停止计算.
const char* str = "abcd";
strlen(str) // 4 常量字符串会以'\0'字符表示该字符串的末尾
const char* str1 = "ab\0cd"
strlen(str1) //2 遇到'\0'字符停止计算
非常量字符串(字符数组) : char* &char []
对于字符数组, 使用strlen 一不注意,就会出现许多问题.
char str[] = {'a', 'b', 'c'};
sizeof(str) // 3 用于计算类型的大小,即str[3]的大小
strlen(str) // 4 & 6 & 9等待输出大于等于3的数字 为什么 ???
上面以及说过,strlen会累计长度,知道出现空字符'\0',则停止计算, 为什么会完整且正确的输出cosnt char* 的内容了,那是因为末尾有'\0'表示结束.
为什么字符数组会出现问题了,那是因为,字符数组不会在末尾以空字符'\0'表示结束,函数strlen底层会一直计算,直到在内存中出现空字符'\0'才会结束.
所以对一个字符数组或者其他类型的数组,我们则需要使用sizeof来计算他的大小或者长度.
strlen就不能计算吗? 那肯定可以,只不过需要进行处理啦
char str[5] = {'a','b','c','d','\0'};
strlen(str) //4 但是str是长度为5的字符串,使用的时候需要+1哦
//特殊情况,中间包含空字符
char str1[4] = {'a','\0','b','c'};
strlen(str1) //1 因为遇到\0就会停止计算长度
//如果要对这个字符串进行操作,但是我们得到的长度不是实际的长度,会出现问题哦
使用,在计算字符数组的时候,尽量使用sizeof来计算.
总结: strlen是函数,运行时计算,会有函数调用的开销,通常计算长度.
sizeof是关键字,在编译期计算,没有运行开销,通常用于计算类型的大小
1 > 对于常量字符串大小的计算,可以使用strlen函数和sizeof关键字
2 >对于字符数组的计算,则最好使用sizeof关键字.strlen则需要小心使用.
补充:
Q:为什么我们在开辟malloc一块字符数组空间的时候,经常调用 memset函数进行全部'\0'操作了?
A:因为使用计算长度的strlen函数,printf函数遇到'\0'字符才会中止.防止内存越界.
printf函数也是遇到'\0'字符才会结束哦.
前面提到字符数组,在来小谈一会.
字符数组到字符指针的过程,是退化,即前者退化为了后者,为什么这么说, 因为字符数组存储的信息,是比字符指针的信息多的,什么时候发生退化,函数传参的时候就会发生
int len(char* str) {
//对指针进行操作
return 0;
}
int main() {
char str[5] = {'a','b',c'','d', '\0'};
len(str) //这里就会发生退化,数组变成了指针传给函数的形参
}
Q:当退化成了指针了,还可以使用sizoef关键字来计算长度了嘛 ?
A: NO,不可以了,此时对指针进行sizeof(str)则是指针的大小,32位是4字节,64位是8字节.
所以,这么防止数组退化为指针了 ???
在C++中,有个叫引用的玩意,和指针很想,但也有差别,什么是引用了?其实就是别名.
int len(char (&str)[5]) { // 引用一个str[5]的对象 防止退化
//此时的str仍然是数组
sizeof(str) // 5 表示是一个长度为5的字符数组
return 0;
}
上面这个方法,有一个缺点就是,形参的长度必须和实参的长度一样,不然就报错,可用性非常低.
其他解决方案:
1 使用模板,提高可用性,形参的参数大小由模板参数来控制.
2.使用C++提供的array类
Q: C/C++为什么会数组退化为指针.
A: 1 C/C++不允许使用一个数组直接初始化另外一个数组, 就无法直接数组传参
2 函数的参数位于栈上,栈空间小,如果数组很大,则会发生爆栈,使用需要退化为指针来传参.