指针(一) - 基本概念

1.1 指针的概念

地址:一般把存储单元中的一个字节称为一个内存单元,不同的数据类型占用的内存单元数不等,为了正确的访问这些内存单元,必须为每个内存单元编上号,内存单元的编号叫做地址。

指针:根据内存单元的编号或地址就可以找到所需的内存单元,通常也把这个地址称为指针。指针是内存单元的地址,是常量。定义指针的目的是通过指针去访问内存单元。指针是一个数据结构的首地址,“指向”一个数据结构。

指针变量:在C语言中允许一个变量来存放指针,这种变量称为指针变量。一个指针变量的值就是某个内存单元的地址或称为某内存单元的指针。指针变量是取值为地址的变量。

变量的指针就是变量的地址。存放变量的地址的变量是指针变量。指针变量的值就是某个变量的地址或称为某变量的指针。

通常把指针变量称为指针。例1:

int a;//一个int类型变量

int *p;//一个指针变量

p=&a;//&是取地址运算符

1.2 指针的内容

简单讲,指针有四个方面的内容:即指针的类型,指针所指向的类型,指针的值,指针本身所占有的内存区

1.2.1 指针的类型:int *,指针本身所具有的类型。

1.2.2 指针所指向的类型:int,指针所指向的类型决定了编译器将把那片内存区里的内容当做什么类型来看待。

1.2.3 指针的值:p=&a,指针的值或者叫指针所指向的内存区或地址,指针p的值就是变量a所占内存的首地址,是指针本身所存储的数值,这个值将被编译器当做一个地址,而不是一个一般的数值。指针所指向的内存区就是从指针的值所代表的那个内存地址开始,长度为sizefo(指针所指向的类型)的一片内存区。以后,所说的一个指针的值是XX,就相当于说该指针指向了以XX为首地址的一片内存区域;所说的一个指针指向了某快内存区域,就相当于说该指针的值是这块内存区域的首地址。

1.2.4 指针本身所占有的内存区:是指针本身所占内存的大小,用函数sizeof(指针的类型)可得。

1.3 指针与内存管理

利用指针可以将数据写图内存中的任意位置,但是,一旦程序中有一个野指针("wild" pointer),即指向一个错误位置的指针数据就危险了—存放在堆中的数据可能会被破坏,用来管理堆的数据结构也可能会被破坏,甚至操作系统的数据也可能会被修改。

1.3.1 内存分配的方式

(1)、从静态存储区域分配。内存在程序编译的时候就已经分配好,这块内存在程序的整个运行期间都存在。例如全局变量,static变量。

(2)、在栈上创建。在执行函数时,函数内局部变量的存储单元都可以在栈上创建,函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集中,效率很高,但是分配的内存容量有限。

(3)、从堆上分配,亦称动态内存分配。程序在运行的时候用malloc或new申请任意多少的内存,程序员自己负责在何时用free或delete释放内存。动态内存的生存期由我们决定,使用非常灵活,但问题也最多。

1.3.2 malloc/free 的使用要点

malloc与free是C/C++语言的标准库函数,它用于申请动态内存和释放内存。

函数malloc的原型如下:void * malloc(size_t size); 

用malloc申请一块长度为length的整数类型的内存,程序如下:int *ip = (int *) malloc(sizeof(int) * length); 

两个要素上:“类型转换”和“sizeof”。

malloc函数返回值的类型是void *,所以在调用malloc时要显式地进行类型转换,将void * 转换成所需要的指针类型。malloc函数本身并不识别要申请的内存是什么类型,它只关心内存的总字节数。例如int变量在16位系统下是2个字节,在32位下是4个字节;而float变量在16位系统下是4个字节,在32位下也是4个字节。这个你可以用sizeof(类型)去测试。

在malloc的“()”中使用sizeof运算符是良好的风格,但要当心有时我们会昏了头,写出 ip = malloc(sizeof(ip))这样的程序来。

函数free的原型是:void free( void * memblock ); 

为什么free函数不象malloc函数那样复杂呢?这是因为指针p的类型以及它所指的内存的容量事先都是知道的,语句free(p)能正确地释放内存。如果p是NULL指针,那么free对p无论操作多少次都不会出问题。如果p不是NULL指针,那么free对p连续操作两次就会导致程序运行错误。

1.3.3 new/delete 的使用要点

对于非内部数据类型的对象而言,光用maloc/free无法满足动态对象的要求。对象在创建的同时要自动执行构造函数,对象在消亡之前要自动执行析构函数。由于malloc/free是库函数而不是运算符,不在编译器控制权限之内,不能够把执行构造函数和析构函数的任务强加于malloc/free。因此C++语言需要一个能完成动态内存分配和初始化工作的运算符new,以及一个能完成清理与释放内存工作的运算符delete。注意new/delete不是库函数,只是C++的运算符。我们来看如下例子就知道怎么回事了。
        class Object
        {
         public :
          Object(void){std::cout << “Initialization”<< std::endl; }
          ~Object(void){std::cout << “Destroy”<< std::endl; }
          void Initialize(void){std:: cout << “Initialization”<< std::endl; }
          void Destroy(void){ std::cout << “Destroy”<< std::endl; }
        }

        void UseMallocFree(void)
        {
         Object *ip = (Object *)malloc(sizeof(Object));    // 申请动态内存
         ip->Initialize();                             // 初始化
         //…

         ip->Destroy();                              // 清除工作
         free(ip);                                   // 释放内存
        }

        void UseNewDelete(void)
        {
         Object *ip = new Object;                     // 申请动态内存并且初始化
         //…
         Delete ip;                                  // 清除并且释放内存
        }
                  用malloc/free和new/delete如何实现对象的动态内存管理

类Object的函数Initialize模拟了构造函数的功能,函数Destroy模拟了析构函数的功能。函数UseMallocFree中,由于malloc/free不能执行构造函数与析构函数,必须调用成员函数Initialize和Destroy来完成初始化与清除工作。函数UseNewDelete则简单得多。所以我们不要企图用malloc/free来完成动态对象的内存管理,应该用new/delete。由于内部数据类型的“对象”没有构造与析构的过程,对它们而言malloc/free和new/delete是等价的。new内置了sizeof、类型转换和类型安全检查功能, ,对于非内部数据类型的对象而言,new在创建动态对象的同时完成了初始化工作。

new/delete 常使用的方法:typeof *ip = new typeof[length];    类/结构 *ip = new 类结构;

一般释放如下:delete ip;

数组的释放如下:delete [] ip;

1.3.4内存耗尽

如果在申请动态内存时找不到足够大的内存块,malloc和new将返回NULL指针,宣告内存申请失败。通常有三种方式处理“内存耗尽”问题。

(1)、判断指针是否为NULL,如果是则马上用return语句终止本函数。例如:
        void Func(void)
        {
         A *a = new A;
         if(a == NULL)
         {
          return;
         }
         …
        } 

 (2)、判断指针是否为NULL,如果是则马上用exit(1)终止整个程序的运行。例如:
        void Func(void)
        {
         A *a = new A;
         if(a == NULL)
         {
          std::cout << “Memory Exhausted” << std::endl;
          exit(1);
         }
         …
        } 

(3)、为new和malloc设置异常处理函数。例如Visual C++可以用_set_new_hander函数为new设置用户自己定义的异常处理函数,也可以让malloc享用与new相同的异常处理函数。一个很重要的现象,对于32位以上的应用程序而言,无论怎样使用malloc与new,几乎不可能导致“内存耗尽”。因为32位操作系统支持“虚存”,内存用完了,自动用硬盘空间顶替。强调:不加错误处理将导致程序的质量很差,千万不可因小失大。

1.3. 5杜绝“野指针”

“野指针”不是NULL指针,是指向“垃圾”内存的指针。人们一般不会错用NULL指针,因为用if语句很容易判断。但是“野指针”是很危险的,if语句对它不起作用。 “野指针”的原因主要有如下几种:

(1)、指针变量没有被初始化。任何指针变量刚被创建时不会自动成为NULL指针,它的缺省值是随机的,它会乱指一气。所以,指针变量在创建的同时应当被初始化,要么将指针设置为NULL,要么让它指向合法的内存。例如
        char *ip = NULL;
        char *ip = new char; 

(2)、指针ip被free或者delete之后,没有置为NULL,让人误以为ip是个合法的指针。

(3)、指针操作超越了变量的作用范围。这种情况让人防不胜防,示例程序如下:
        class A 
        { 
         public:
          void Func(void){ std::cout << “Func of class A” << std::endl; }
        };
        void Test(void)
        {
         A *p;
         {
          A a;
          p = &a; // 注意 a 的生命期
         }
         p->Func(); // p是“野指针”
    } 

函数Test在执行语句p->Func()时,对象a已经消失,而p是指向a的,所以p就成了“野指针”。但奇怪的是有些编译器运行这个程序时居然没有出错,这可能与编译器有关。

1.3.6指针参数的传递

如果函数的参数是一个指针,不要指望用该指针去申请动态内存。见如下例子:
        void GetMemory(char *ip, int num)
        {
         ip = (char *)malloc(sizeof(char) * num);
        }
        void Test(void)
        {
         char *str = NULL;
         GetMemory(str, 100); // str 仍然为 NULL 
         strcpy(str, "hello"); // 运行错误
        }
              试图用指针参数申请动态内存

毛病出在函数GetMemory中。编译器总是要为函数的每个参数制作临时副本,指针参数ip的副本是 _ip,编译器使 _ip = ip。如果函数体内的程序修改了_ip的内容,就导致参数ip的内容作相应的修改。这就是指针可以用作输出参数的原因。在本例中,_ip申请了新的内存,只是把_ip所指的内存地址改变了,但是ip丝毫未变。所以函数GetMemory并不能输出任何东西。事实上,每执行一次GetMemory就会泄露一块内存,因为没有用free释放内存。

如果非得要用指针参数去申请内存,那么应该改用“指向指针的指针”,见如下示例:
        void GetMemory(char **p, int num)
        {
         *ip = (char *)malloc(sizeof(char) * num);
        }
        void Test(void)
        {
         char *str = NULL;
         GetMemory(&str, 100); // 注意参数是 &str,而不是str
         strcpy(str, "hello"); 
            std::cout<< str << std::endl;
         free(str); 
        }
              用指向指针的指针申请动态内存

当然,我们也可以用函数返回值来传递动态内存。这种方法更加简单,见如下示例:
        char *GetMemory(int num)
        {
         char *ip = (char *)malloc(sizeof(char) * num);
         return ip;
        }
        void Test(void)
        {
         char *str = NULL;
         str = GetMemory(100); 
            strcpy(str, "hello");
         std::cout<< str << std::endl;
         free(str); 
        }
               用函数返回值来传递动态内存

用函数返回值来传递动态内存这种方法虽然好用,但是常常有人把return语句用错了。这里强调不要用return语句返回指向“栈内存”的指针,因为该内存在函数结束时自动消亡,见如下示例:
        char *GetString(void)
        {
         char p[] = "hello world";
         return p; // 编译器将提出警告
        }
        void Test(void)
        {
         char *str = NULL;
         str = GetString(); // str 的内容是垃圾
         std::cout<< str << std::endl;
        }
             return语句返回指向“栈内存”的指针

如下使用规则:
    【规则1】用malloc或new申请内存之后,应该立即检查指针值是否为NULL。防止使用指针值为NULL的内存。
    【规则2】不要忘记为数组和动态内存赋初值。防止将未被初始化的内存作为右值使用。
    【规则3】避免数组或指针的下标越界,特别要当心发生“多1”或者“少1”操作。
    【规则4】动态内存的申请与释放必须配对,防止内存泄漏。
    【规则5】用free或delete释放了内存之后,立即将指针设置为NULL,防止产生“野指针”。

1.4指针的运算

1.4.1赋值运算

指针变量的赋值运算有以下几种形式:

    1.4.1.1指针变量初始化赋值如下: 
            int a;
            int *ip=&a;

    1.4.1.2把一个变量的地址赋予指向相同数据类型的指针变量。例如:
            int a;
            int *ip;
            ip=&a;             //把整型变量a的地址赋予整型指针变量ip

    1.4.1.3把一个指针变量的值赋予指向相同类型变量的另一个指针变量。例如:
            int a;
            int *pa=&a;
            int *pb;
            pb=pa;              //把a的地址赋予指针变量pb

    由于pa,pb均为指向整型变量的指针变量,因此可以相互赋值。

    1.4.1.4把数组的首地址赋予指向数组的指针变量。例如:
            int a[5],*pa;
            pa=a;               //数组名表示数组的首地址,故可赋予指向数组的指针变量pa

    也可写为:
            pa=&a[0];           //数组第一个元素的地址也是整个数组的首地址也可赋予pa

    当然也可采取初始化赋值的方法:
            int a[5],*pa=a;

    以上是一些基本的数组赋值方法,后面我们会详细讨论指针在数组中的使用。

    1.4.1.5把字符串的首地址赋予指向字符类型的指针变量。例如:
            char *pc;
            pc="c language";

    或用初始化赋值的方法写为:
            char *pc=" c language ";

    这里应说明的是并不是把整个字符串装入指针变量, 而是把存放该字符串的字符数组的首地址装入指针变量。

    1.4.1.6把函数的入口地址赋予指向函数的指针变量。例如:
            int (*pf)();
            pf=f;                //f为函数名

    1.4.2加减运算

对于指向数组的指针变量,可以加上或减去一个整数n。设ip是指向数组a的指针变量,则ip+n,ip-n,ip++,++ip,ip--,--ip 运算都是合法的。指针变量加或减一个整数n的意义是把指针指向的当前位置(指向某数组元素)向前或向后移动n个位置。应该注意,数组指针变量向前或向后移动一个位置和地址加1或减1 在概念上是不同的。因为数组可以有不同的类型, 各种类型的数组元素所占的字节长度是不同的。如指针变量加1,即向后移动1 个位置表示指针变量指向下一个数据元素的首地址。而不是在原地址基础上加1。看如下例子:
        char a[20];
        int*ip=a;
        ...
        ip++;

在上例中,指针ip的类型是int*,它指向的类型是int,它被初始化为指向整形变量a。接下来的第3句中,指针ip被加了1,编译器是这样处理的:它把指针ip的值加上了sizeof(int),在32位程序中,是被加上了4。由于地址是用字节做单位的,故ip所指向的地址由原来的变量a的地址向高地址方向增加了4个字节。由于char类型的长度是一个字节,所以,原来ptr是指向数组a的第0号单元开始的四个字节,此时指向了数组a中从第4号单元开始的四个字节。再看如下例子:
        char a[20];
        int*ip=a;
        ...
        ip+=5;

在这个例子中,ip被加上了5,编译器是这样处理的:将指针ip的值加上5乘sizeof(int),在32位程序中就是加上了5乘4=20。由于地址的单位是字节,故现在的ip所指向的地址比起加5后的ip所指向的地址来说,向高地址方向移动了20个字节。在这个例子中,没加5前的ip指向数组a的第0号单元开始的四个字节,加5后,ptr已经指向了数组a的合法范围之外了。虽然这种情况在应用上会出问题,但在语法上却是可以的。这也体现出了指针的灵活性。

如果上例中,ip是被减去5,那么处理过程大同小异,只不过ip的值是被减去5乘sizeof(int),新的ip指向的地址将比原来的ip所指向的地址向低地址方向移动了20个字节。

总结一下,一个指针ipold加上一个整数n后,结果是一个新的指针ipnew,ipnew的类型和ipold的类型相同,ipnew所指向的类型和ipold所指向的类型也相同。ipnew的值将比ipold的值增加了n乘sizeof(ipold所指向的类型)个字节。就是说,ipnew所指向的内存区将比ipold所指向的内存区向高地址方向移动了n乘sizeof(ipold所指向的类型)个字节。一个指针ipold减去一个整数n后,结果是一个新的指针ipnew,ipnew的类型和ipold的类型相同,ipnew所指向的类型和ipold所指向的类型也相同。ipnew的值将比ipold的值减少了n乘sizeof(ipold所指向的类型)个字节,就是说,ipnew所指向的内存区将比ipold所指向的内存区向低地址方向移动了n乘sizeof(ipold所指向的类型)个字节。

1.4.3关系运算

指向同一个数组中的不同元素的两个指针可以进行各种关系运算。例如:

        ip1==ip2表示ip1和ip2指向同一数组元素

        ip1>ip2表示ip1处于高地址位置

        ip1<ip2表示ip2处于低地址位置

指针变量还可以与0比较。设ip为指针变量,则ip==0表明ip是空指针,它不指向任何变量;ip!=0表示ip不是空指针。空指针是由对指针变量赋予0值而得到的。例如:
        #define NULL 0
        int *ip=NULL;

对指针变量赋0值和不赋值是不同的。指针变量未赋值时,可以是任意值,是不能使用的。否则将造成意外错误。而指针变量赋0值后,则可以使用,只是它不指向具体的变量而已。

1.4.4取地址运算符‘&’和取内容运算符‘*’

取地址运算符&是单目运算符,其结合性为自右至左,其功能是取变量的地址。

取内容运算符*是单目运算符,其结合性为自右至左,用来表示指针变量所指的变量。在*运算符之后跟的变量必须是指针变量。需要注意的是指针运算符*和指针变量说明中的指针说明符* 不是一回事。在指针变量说明中,‘*’是类型说明符,表示其后的变量是指针类型。而表达式中出现的‘*’则是一个运算符用以表示指针变量所指的变量。如下例子:
        int a=12;
        int b;
        int *p;

        int **ptr; 
        p=&a;   //&a的结果是一个指针,类型是int*,指向的类型是int,指向的地址是a的地址。
        *p=24;   //*p的结果,在这里它的类型是int,它所占用的地址是p所指向的地址。
        ptr=&p; //&p的结果是个指针,该指针的类型是p的类型加个*,在这里是int **。该指针所指向的类型是p的类型,这里是int*。该指针所指向的地址就是指针p自己的地址。
        *ptr=&b;//*ptr是个指针,&b的结果也是个指针,且这两个指针的类型和所指向的类型是一样的,所以用&b来给*ptr赋值就是毫无问题的了。
        **ptr=34;//*ptr的结果是ptr所指向的东西,在这里是一个指针,对这个指针再做一次*运算,结果就是一个int类型的变量。

1.4.5关于括号组合

在解释组合说明符时, 标识符右边的方括号和圆括号优先于标识符左边的“*”号,而方括号和圆括号以相同的优先级从左到右结合。但可以用圆括号改变约定的结合顺序。阅读组合说明符的规则是“从里向外”。从标识符开始,先看它右边有无方括号或园括号,如有则先作出解释,再看左边有无*号。 如果在任何时候遇到了闭括号,则在继续之前必须用相同的规则处理括号内的内容。

1.5指针表达式

一个表达式的最后结果如果是一个指针,那么这个表达式就叫指针表式。所以指针表达式也具有指针所具有的四个要素:指针的类型,指针所指向的类型,指针指向的内存区,指针自身占据的内存。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值