1. 字符串:
字符串有两种:C 类型的以及C++ 类型的
1.1. C 类型字符串
C类型的其实就是char *或者char[]类型。
1.1.1. char *类型字符串
有以下定义形式:
char c = 'a' ;
char *pc = &c; // 虽然是char *类型,其实代表的是指针
char *str1 = "abc" ; // C 字符串
const char * str2 = "abc" ; // C 字符串
"abc" ; // 字面类型常量,内存形态与C 字符串相同
|
如果代表的是char的指针,则sizeof返回指针的长度是4(x86)或者8(x64)。
所以,以上的pc, str1, str2, "abc"均返回4/8
strlen则不同,strlen的实现类似如下:
size_t strlen ( const char *str)
{
if (!str)
// 实现异常处理
size_t len = 0;
while (*str++) ++len;
return len;
}
|
所以,他是根据'\0'判断字符串结尾的,用于指向字符的指针是错误的,会导致Undefined Behavior。
结果如下:
char c = 'a' ;
char *pc = &c; sizeof (pc) -> 4/8 strlen (pc) -> Undefined Behavior
char *str1 = "abc" ; sizeof (str1) -> 4/8 strlen (str1) -> 3
|
1.1.2. char[]类型字符串
需要注意的不同容量的数组可能会容纳相同内容的字符串,以及隐式指定数组大小。
虽然数组名可以转换为对应的指针,但实际上数组名还包含了数组的大小,所以char *和char[]还是有区别的。
sizeof(char *)会返回指针的长度-> 4/8
sizeof(char[n])会返回数组的长度 -> n*1,这里不是数组的元素数,而是数组占用内存的长度=元素数*元素大小
而strlen只是单纯得去找'\0',例子中的数组内容各不相同,结果却都相同。
char
str1[] =
"abc"
;
sizeof
(str1) -> 4(4
=3+1,1为结束字符所占的内存)
strlen
(str1) -> 3
char str2[] = "abc\0" ; sizeof (str2) -> 5 strlen (str2) -> 3
char str3[10] = "abc" ; sizeof (str3) -> 10 strlen (str3) -> 3
char str4[20] = "abc\0abc" ; sizeof (str4) -> 20 strlen (str4) -> 3
|
1.2. C++ 类型字符串
string对象除了包含字符串内容,还包含了很多其他的东西,sizeof(string 对象)远大于字符串的大小,此外,strlen也不适用于string对象。
string的c_str()成员函数返回对应的C类型字符串,可以对其应用strlen。
string有内置的返回长度的成员函数size/length。
注意:内置的size/length的机制是基于vector的,返回内置vector的size,所以结果可能与strlen不同
string str1 = "abc" ; sizeof (str1) -> 依赖于实现
strlen (str1.c_str()) -> 3
str1.size() -> 3
string str2 = "abc" ;
str2.push_back(0);
str2.push_back( 'a' );
str2.push_back( 'b' ); sizeof (str2) -> 依赖于实现
strlen (str2.c_str()) -> 3
str2.length() -> 6
|