正是指针使C威力无穷。有些任务用其他语言也可以实现,但C能够更有效地实现;有些任务无法用其他语言实现,如访问硬件,但C却可以实现。
——《C和指针》,〔美〕Kenneth A.Reek
上一篇文章中我们初步讨论了指针究竟是什么,并得出了结论:指针就是一个特殊的十六进制整型变量(以下统称指针)。
但既然知晓了指针的本质,我们就不得不考虑在此之上延伸出来的问题,也就是:
指针怎么用
要讨论这个,我们就不得不提及一部分基础的计算机,不感兴趣的朋友可以直接略过这部分,但我建议你们读一下,也许就和你知道的有所出入呢?
堆和栈和堆区和栈区
通常来说,C/C++程序的内存结构由5个部分组成:代码区、常量区、静态区、堆区、栈区,关于前三者我们晚点会学到,现在让我们先专注于堆区和栈区。
重要:堆栈和堆区栈区并不是等同的概念,前者是两种数据结构,而后者只是内存模型的概念
关于两者的大致区别,这里有一张表格
堆区 | 栈区 |
---|---|
手动申请 | 自动分配 |
不会被自动回收 | 会被自动回收 |
空间较大 | 空间较小 |
关于基础知识就介绍到这个位置,下面就让我们谈谈20世纪最伟大的发明——至少是C语言里最伟大的,指针。但它究竟该怎么用?
普通指针
虽然普通指针其实并不普通,不过相较于其他几个可能性来讲该说是最简单的用法了,你只需要声明一个装整数的指针变量:
int *p;
然后从随便什么地方得到地址:
int i,j;
p=&i;
int *a=&j;
p=a;
就可以对这个指针进行操作了,非声明的时候,*p代表的意思就是取值(即获取指向的变量),但是千万要注意一点,指针的增加1是一次性增加变量长度*1个字节,而不是通常的1个字节。
小贴士:取值运算符(*)的优先级要低于结构运算符(.),在实际使用的时候一定要注意结构体指针要像这样使用(*p).a;,否则*p.a会被解析成*(p.a)的~
指针函数
这大概是C语言里面仅次于普通指针常见的用法了,它会返回一个十六进制整数,在没有BUG的情况下会使它指向堆区上的某个逻辑地址——老天保佑,千万不要返回栈区地址,除非你真的确信你在做什么。
指针函数的调用和往常一样简单,只是声明微微异于常人:
void* sum();
int *xyz();
看,C语言的混乱又简洁的特性在这个地方一览无余——如果没有一个简单的原则,不管是编译器的设计者、老手程序员,还是像你一样的初学者,都会为这个在空格左右反复横跳的*头痛不已,好在我们有一个完美的解决方案——尽管有一点点长:
“空格在这种时候可以被忽视”
“指针标识符(*)用于在声明时修饰变量名”
你看,所以你完全不必担心诸如char** argv、char* *argv和char **argv究竟有什么不同,赞美丹尼斯。
指针数组和数组指针
当我们解决了返回值为指针变量的指针函数的问题之后,也许是时候看看基础一点的东西,比如main函数的这个参数:
char** argv
char* argv[]
char argv[][]
严格来说,他们其实是一种东西——一个字符串列表,所以char* argv[]应该算是最符合其义的使用方式,但不幸的是,恶劣的工作环境(主要是历史遗留问题,这类问题在C语言的标准演进中体现的淋漓尽致)导致一部分程序员不得不成天泡在类似void main和char** argv之类的代码中——愿林纳斯保佑他们的头发。
回到正题,要讲明白指针数组究竟是个什么东西,我们必须首先申明数组的基本实现原理:一个指针。
这一点其实在字符串的使用上体现的最为明显,考虑如下代码:
char s[]={"hello world"};
printf("%c",*(s+4));
有兴趣的同学可以尝试一下将这段代码丢进main函数里执行,看看是不是会如期的打印s[4](即字符’o’)。
事实上,有很多Basic程序员会很高兴的看到,C语言的数组调用a[x],实际上是像(*(a+x))这样执行的,这同样也能解释为什么明明申请的时候需要从1开始记(因为是变量长度乘以总长度),而数组下标是要从0开始操作了。因此也可以说,数组的本质同样是指针,只是数组这个指针的管理权被编译器和系统夺走了而已(同样也因此,数组被置于栈区——而不是堆区)。
谈论完数组的本质,回到我们今天的出发点之一:指针数组,相信绝大部分人现在都已经完全能够反应过来,指针数组其实就是二维数组嘛。
这倒也差不多,你甚至可以使用argv[a][b]的形势去访问**argv里的东西,但千万要注意:不要下标越界,会出大事的。
不过,在这里要提及一个特例,还有特例中的特例:字符串。
众所周知字符串是C里面和指针并称难顶双雄的存在,相信看完我的文章,他就会是你唯一头疼的问题了——其实我也头疼。不过我们今天要讲的并不是怎么分割、替换或者是别的什么东西,而是更简洁一点的两条规则:
char* s="string"的家伙事儿,就仅仅就是在静态区创建一个字符数组[‘s’,‘t’,‘r’,‘i’,‘n’,‘g’,’\0’],然后把s指向静态区那旮沓而已,所以千万不要摆弄这样式儿滴指针
——东北夏尔,刚刚说完
字符数组以字符串的形势初始化的时候会自动缀上’\0’,除非你一个字符一个字符的处理它
——山东夏尔,正在变成东北夏尔
你看,其实了解了一些原则之后,指针也并非那么吓人。
准备好来点更高深的东西了吗?准备好了?那今天也没有了…让我歇歇吧(茶)下次我们来讲讲臭名昭著的函数指针,还有最开始的——指向指向指针函数的函数指针数组的指针(反正差不多是这个意思),让我们下期见。
文章指北
浅论指针(三)