(最近读C primer plus,做一点笔记)
正文
C语言中字符串数组初始化有两种方式:数组或者指针
char s1[] = "Hello world";
char * s2 = "Hello world";
这里的s1和s2都是指向字符串的指针(也是第一个元素的地址),被引用的字符串常量决定了分配给字符串的存储空间大小。两种方式效果相似,但不完全相同。
1. 在数组形式中,"Hello world"存储在可执行文件的数据段部分。当程序被加载到内存中时,该字符串也被加载到内存中,且位于静态存储区(字符串常量都是这样);当程序开始执行时,计算机按"Hello world"的大小给s1分配内存空间,然后把"Hello world"中的元素逐一拷贝给s1,再附加一个 '\0' 。编译器会把s1看做数组首元素的地址。更重要的是,数组形式中s1是一个地址常量,你不能更改s1,比如不可以s1++,但可以用s1+1访问别的元素。
2. 在指针形式中,程序开始执行时,需要一个指针变量s2存储字符串的地址,把被引用字符串的地址拷贝过来。这个变量初始时指向字符串的第一个字符,但它的值是可以改变的。因此,可以对它使用增量运算符,例如:
char s1[] = "Hello world";
char * s2 = "Hello world";
s2 += 2;
printf("%s %s\n", s1, s2);
输出的s2是 llo world,但s1就无法修改。
总结
数组初始化是从静态存储区把一个字符串复制给数组,而指针初始化只是复制字符串的地址。
拓展
如果要修改字符串中的元素,s1可以
s1[0] = 'D';
因为数组的元素是变量,但数组名不是变量。(得益于数组形式的初始化,数组中的元素都是拷贝来的)
但要修改s2,这样是不允许的,会有奇怪的错误(比如中断),所以建议指针形式初始化时,前面加const,表示不能修改。