一、原文:解析char *p与char p[]
作者:Logic0
链接:http://www.cnblogs.com/Logic0/archive/2009/08/01/1850337.html 点击打开链接
见论坛上有人讨论这个问题,感觉也是涉及面比较广,而且很多人犯过这个错误,比如声明char *p = "hello world!";却妄图用p指针改变字符串内容,所以就这个问题,我总结了一下。转载注明作者Logic0以及出处。
主要解析的问题:
问题1:
#include "stdio.h"
char *get_string_1()
{
char p[] = "hello world!";
return p;
}
char *get_string_2()
{
char *p = "hello world!";
return p;
}
int main()
{
char *p;
p = get_string_1();
printf("get_string_1:%s\n",p);
p = get_string_2();
printf("get_string_2:%s\n",p);
return 0;
}
输出:
get_string_1:(乱码或者没有输出),linux下没有任何输出
get_string_2:hello world!
为什么会这样?
问题2:
char *p = "hello world!";这样写到底合不合法,实际应用中能不能这样写。
问题3:
char *p = "hello world!";与char p[]="hello world!";有什么细节和操作上的差异。
解析:
char *p = "hello world!";与char p[] = "hello world!"; 两者都用来声明一个字符串,并将其初始化为hello world!,但是表示的意义确是大不相同。
从其声明的对象来说:
char p[] = "hello world!";用来声明一个数组p,数组大小为12字节。
char *p = "hello world!";用来声明一个指针p,指向“hello world!”字符串起始位置。
从存储位置来说:
char p[] = "hello world!";p数组作为局部变量被存储在栈区;
char *p = "hello world!"; 在这个声明中,"hello world!"被存储在静态数据区,而且是全局的,p仅仅就是个指针,指向这个区域。不信的话你可以试试下边的代码,看是不是同一个地址:
char *p1 = "hello world!";
char *p2 = "hello world!";
printf("p1:%x\np2:%x\n",p1,p2);
从函数执行后的扫尾工作来看:
C函数执行完之后对栈区进行清除操作,对静态数据区和堆则没有,因此第一个问题也就不难解释了,get_string_1()函数执行完就释放了栈区内存,所以根本就不存在存有"hello world!"声明时的内存,也就不可能有所输出。
那么,写成char *p = "hello world!";到底合不合法呢?能不能这样写呢?
这是一个历史问题,在const关键字被引入C语言之前,这样写是合法的,而且存在了很长的一段时间,大量的代码在此期间运用了这种写法,新版C语言为了兼容,故允许这样写,但最好不要这样,因为这种写法终会被淘汰,说不定哪天你的代码用了新版的编译器,然后莫名的出了问题,要找这个BUG估计不是一件容易的事。现在最好写成:
const char *p = "hello world!";
或者
char p[] = "hello world!";
那他们在操作和细节上有什么区别呢?
区别很多,由于本人才疏学浅,只总结出以下几点,望有知者补充:
1. char *p = "hello world!"; 可以用p++操作,sizeof(p) == 4;
2.char p[]="hello world!"; sizeof(p) == 12;
二、
原文:char *p 与char p[] 比较
链接:http://blog.chinaunix.net/uid-9435177-id-2002675.html点击打开链接
所有的字符窜常量都被放在静态内存区
因为字符串常量很少需要修改,放在静态内存区会提高效率
例:
char str1[] = "abc";
char str2[] = "abc";
const char str3[] = "abc";
const char str4[] = "abc";
const char *str5 = "abc";
const char *str6 = "abc";
char *str7 = "abc";
char *str8 = "abc";
cout << ( str1 == str2 ) << endl;
cout << ( str3 == str4 ) << endl;
cout << ( str5 == str6 ) << endl;
cout << ( str7 == str8 ) << endl;
结果是:0 0 1 1
str1,str2,str3,str4是数组变量,它们有各自的内存空间;
而str5,str6,str7,str8是指针,它们指向相同的常量区域。
char *c = "chengxu"
"chengxu"的类型是const char *,编译器在编译时会在静态数据区为"chengxu"分配空间存储这个字符串,然后将字符串的首地址赋给字符指针char *c 。到于const char *赋给char *是因为在c语言时代这已成为一种习惯写法。所以,当使用指针c试图改变"chengxu"时,如:c[0]='a',编译不会出错,但运行时会出错。改成
char c[]="chengxu"就不会出错了。char c[]="chengxu"先在内存开辟一连续存储单元,然后将字符串存到存储单元。
函数中可以返回已经申请空间的局部变量的指针。
char *str()
{
}
问题的引入:
看看下面的程序的输出:
#include <stdio.h>
char *returnStr()
{
}
int main()
{
}
这个没有任何问题,因为"hello world!"是一个字符串常量,存放在静态数据区,
把该字符串常量存放的静态数据区的首地址赋值给了指针,
所以returnStr函数退出时,该该字符串常量所在内存不会被回收,故能够通过指针顺利无误的访问。
但是,下面的就有问题:
#include <stdio.h>
char *returnStr()
{
}
int main()
{
}
"hello world!"是一个字符串常量,存放在静态数据区,没错,
但是把一个字符串常量赋值给了一个局部变量(char []型数组),该局部变量存放在栈中,
这样就有两块内容一样的内存,也就是说“char p[]="hello world!";”这条语句让“hello world!”这个字符串在内存中有两份拷贝,一份在动态分配的栈中,另一份在静态存储区。这是与前者最本质的区别,
当returnStr函数退出时,栈要清空,局部变量的内存也被清空了,
所以这时的函数返回的是一个已被释放的内存地址,所以打印出来的是乱码。
如果函数的返回值非要是一个局部变量的地址,那么该局部变量一定要申明为static类型。如下:
#include <stdio.h>
char *returnStr()
{
}
int main()
{
}
这个问题可以通过下面的一个例子来更好的说明:
#include <stdio.h>
//返回的是局部变量的地址,该地址位于动态数据区,栈里
char *s1()
{
}
//返回的是字符串常量的地址,该地址位于静态数据区
char *s2()
{
}
//返回的是静态局部变量的地址,该地址位于静态数据区
char *s3()
{
}
int main()
{
}
运行输出结果:
in s1 p=0013FF0C
in s1 p1=00431084
in s1: string's address: 00431074
in s1 p2=00431070
in s2 q=00431074
in s2: string's address: 00431074
in s3 r=00434DC0
in s3: string's address: 00431074
in main:p=0013FF0C, q=00431074, r=00434DC0
$
Hello world!
Hello world!
这个结果正好应证了上面解释,同时,还可是得出一个结论:
字符串常量,之所以称之为常量,因为它可一看作是一个没有命名的字符串且为常量,存放在静态数据区。
这里说的静态数据区,是相对于堆、栈等动态数据区而言的。
静态数据区存放的是全局变量和静态变量,从这一点上来说,字符串常量又可以称之为一个无名的静态变量,
因为"Hello world!"这个字符串在函数 s1和s2 中都引用了,但在内存中却只有一份拷贝,这与静态变量性质相当神似。