1、字符串的概念
- 字符串是有序字符的集合
- 字符串是程序中的基本元素之一
- C语言中没有字符串的概念
— C语言通过特殊的字符数组模拟字符串
— C语言中的字符串是以'\0'
结尾的字符数组
2、字符数组与字符串
- 在C语言中,双引号引用的单个或多个字符是一种特殊的字面量
— 存储于程序的全局只读存储区
— 本质为字符数组,编译器自动在结尾加上'\0'
字符
下面哪些是字符串的定义?
char ca[] = { 'H','e', 'l', 'l', 'o' }; //字符数组
char sa[] = { 'W','o', 'r', 'l', 'd' ,'\0'}; //字符串
char ss[] = "Hello,World!"; //字符串
char *str = "Hello,World!"; //字符串
我们把上文中的 1 称为字符数组的定义,用来定义字符;而上文中的2,3,4就是字符串的定义。
#include <stdio.h>
int main()
{
char ca[] = { 'H','e', 'l', 'l', 'o' };
char sa[] = { 'W','o', 'r', 'l', 'd' ,'\0'};
char ss[] = "Hello,World!";
char *str = "Hello,World!";
printf("%s\n", ca);
printf("%s\n", sa);
printf("%s\n", ss);
printf("%s\n", str);
return 0;
}
第一行输出乱码的原因在于字符数组肯定不能以%s
的格式输出
从结果推断,sa,ss,str都是字符串,而ca是字符数组。
3、鲜为人知的小秘密
— 字符串字面量的本质是一个数组
— 字符串字面量可以看做常量指针
— 字符串字面量中的字符不可改变
— 字符串字面量至少包含一个字符('\0'
)
#include <stdio.h>
int main()
{
char ca[] = { 'H','e', 'l', 'l', 'o' };
char sa[] = { 'W','o', 'r', 'l', 'd' ,'\0'};
char ss[] = "Hello,World!";
char *str = "Hello,World!";
printf("%c\n", str[0]);
printf("%c\n", str[1]);
return 0;
}
从这个程序基本可以推断字符串字面量的本质是一个数组。
4、字符串字面量
“Hello World"
是一个无名数组
下面的表达正确吗?
char b = "abc"[0];
char c = *("123" + 1);
char t = *"";
在C语言中 char 型数据在内存中是以 ASCII 码的形式存储。
在C语言中,char 型数据是将一个字符常量放到一个字符变量中,并不是把该字符本身放到内存单元中去,而是将该字符的相应的ASCII代码放到存储单元中。
C语言使字符型数据和整型数据之间可以通用。一个字符数据既可以以字符形式输出,也可以以整数形式输出。
以字符形式输出时,需要先将存储单元中的ASCII码转换成相应字符,然后输出。以整数形式输出时,直接将ASCII码作为整数输出。
#include <stdio.h>
int main()
{
char b = "abc"[0];
char c = *("123" + 1);
char t = *"";
printf("%c\n", b);
printf("%c\n", c);
printf("%d\n", t);
printf("%s\n", "Hello");
printf("%p\n", "World");
return 0;
}
综上分析:我们可以把例如 “Hello World"
这样一串字符串直接当做数组名。
5、字符串的长度
- 字符串的长度就是字符串所包含字符的个数
- 字符串长度指的是第一个
‘\0’
字符前出现的字符个数 - 通过
‘\0’
结束符来确定字符串的长度 - 函数strlen用于返回字符串的长度(不包括
‘\0’
)
#include <stdio.h>
#include <string.h>
int main()
{
char s[] = "Hello\0world";
for (int i = 0; i < sizeof(s) / sizeof(*s); i++)
{
printf("%c\n", s[i]);
}
printf("%d\n", strlen(s));
printf("%d\n", strlen("123"));
printf("%d\n", sizeof(s));
return 0;
}
对于求字符串的长度,我们可以适当总结一下:
一般字符串的长度我们都用 strlen 来算,strlen受 ‘\0’
的影响,而且strlen算出的结果不包括‘\0’
。
如果用 sizeof 算长度算的是它占的字节大小,所以要加上末尾隐藏的‘\0’
这一个长度,如果中间也出现‘\0’
,把它加上,算一个长度。
例题:
str1是字符数组作为函数参数,所以退化为指针,sizeof(str1) = 4
str2为指针,所以sizeof(str2) = 4
sizeof(str3) = 算数组占的字节大小 = 3
sizeof(“hello”) = 6