在C语言中,字符串(string,简称串)是一种特殊的char型一维数组。可以把字符串中的字符作为数组中的元素访问,或利用char型指针对其访问。
字符串和字符指针
首先是字符串常量的存储,字符串常量是用一对双引号括起来的字符序列,与基本类型常量的存储相似,字符串常量在内存中的存放位置由系统自动安排。
由于字符串常量是一串字符,通常被视为一个特殊的一维字符串数组,与数组的存储类似,字符串常量中的所有字符在内存中连续存放。所以,系统在存储一个字符串常量时先给定一个起始地址,从该地址指定的存储单元开始,连续存放。显然,该起始地址代表存放字符串常量首字符的存储单元的地址,被称为字符串常量的值。
如果定义一个字符指针接收字符串常量的值,该指针就指向字符串的首字符。这样,字符数组和字符指针都可以用来处理字符串。例如:
char sa[] = "array";
char* sp = "point";
printf("%s ", sa); //数组名sa作为printf的输出参数
printf("%s ", sp); //字符指针sp作为printf的输出参数
printf("%s\n", "string"); //字符串常量作为printf的输出参数
输出:array point string
上面调用printf()
函数时,以%s
的格式输出字符串时,作为输出参数,数组名sa
、指针sp
和字符串"string"
的值都是地址,从该地址所指定的单元开始连续输出其中的内容(字符),直到遇到'\0'
为止。由此,字符串中其他字符的地址也能作为输出参数,例如:
printf("%s ", sa + 2); //数组元素sa[2]作为printf的输出参数
printf("%s ", sp + 3); //sp+3作为起始地址
printf("%s\n", "string" + 1);
输出:ray nt tring
字符数组和字符指针的区别
字符数组和字符指针都可以处理字符串,但两者之间有重要区别。例如:
char sa[] = "This is a string";
char* sp = "This is a string";
字符数组sa
在内存中占用了一块连续的单元,有确定的地址,每个数组元素放字符串的一个字符,字符串就存在数组中。
字符指针sp
只占用一个可以存放地址的内存单元,存储字符串首字符的地址,而不是将字符串存放到字符指针变量中去。
如果要改变数组sa所代表的字符串,只能改变数组元素的内容。如果要改变指针sp所代表的字符串,通常直接改变指针的值,让它指向新的字符串。因为sp是指针变量,它的值可以改变,转而指向其他单元。例如:
strcpy(sa, "Hello");
sp = "Hello";
而sa="Hello";
是非法的,因为数组名是常量,不能对它赋值。
常用的字符串处理函数
字符串输入输出
函数scanf()
和gets()
可用来输入字符串,printf()
和puts()
输出字符串。它们在系统文件stdio.h
中定义。
printf()
和puts()
的区别在于,后者输出字符串后会自动换行。
scanf()
和gets()
的区别在于,前者遇到空格或者回车结束输入,后者遇到回车结束输入,即scanf()
只能输入不带空格的字符串,而gets()
没有这个限制。
字符串的复制、连接和比较及字符串长度
-
字符串复制
char* strcpy(char* s1, char* s2)
参数s1必须是字符数组基地址,参数s2可以是字符数组名或字符串常量,函数将s2复制到s1,直到遇到s2的'\0'
为止。s1要有足够的空间,且s1中的内容将被覆盖,函数返回s1。 -
字符串连接
strcat(s1, s2)
参数s1必须是字符数组基地址,参数s2可以是字符数组名或字符串常量,函数将s2接到s1的后面,s1原有的'\0'
被放置在连接后的结束位置上。 -
字符串比较
strcmp(s1, s2)
参数s1和s2可以是字符数组名或字符串常量,函数返回一个整数,给出字符串的比较结果:
(1)若s1和s2相等,返回0
(2)若s1大于s2,返回一个正数
(3)若s1小于s2,返回一个负数
其规则是:从两个字符串首字符开始,依次比较相对应的字符(ASCII码),直到出现不同字符或者遇到'\0'
为止。若所有字符都相等,则返回0;否则,以第一个不相同字符比较结果为准,返回这两个字符的差(第一个减去第二个)。
注意:ANSI标准规定,返回值为正数,负数,0 。而确切数值是依赖不同的C实现的:
当两个字符串不相等时,C标准没有规定返回值会是1 或 -1,只规定了正数和负数。
有些会把两个字符的ASCII码之差作为比较结果由函数值返回。但无论如何不能以此条依据作为程序中的流程逻辑。 -
字符串长度
strlen(s1)
参数s1可以是字符数组名或字符串常量,函数返回字符串s1的'\0'
之前的字符个数。
举例
//声明和初始化:
char s1[] = "beautiful big sky country", s2[] = "how now brown cow";
函数(表达式) | 值 |
---|---|
strlen(s1) | 25 |
strlen(s2 + 8) | 9 |
strcmp(s1, s2) | negative integer |
语句 | 打印内容 |
---|---|
printf("%s", s1 + 10); | big sky country |
strcpy(s1 + 10, s2 + 8); strcat(s1, “s!”); printf("%s", s1); | beautiful brown cows! |