《C语言深度解剖》--学习笔记

最新推荐文章于 2019-01-04 11:03:55 发布

IT小男孩

最新推荐文章于 2019-01-04 11:03:55 发布

阅读量1.1k

点赞数

分类专栏： C语言深度解析

本文链接：https://blog.csdn.net/GOGOmusic/article/details/80341540

版权

C语言深度解析专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1、什么是定义，什么是声明

什么是定义？什么是声明？它们有何区别?
举个例子：
A)int i；
B)extern int i；(关于extern，后面解释)
什么是定义：所谓的定义就是(编译器)创建一个对象，为这个对象分配一块内存并给它取上一个名字，这个名字就是我们经常所说的变量名或对象名。但注意，这个名字一旦和这块内存匹配起来(可以想象是这个名字嫁给了这块空间，没有要彩礼啊。^_^)，它们就同生共死，终生不离不弃。并且这块内存的位置也不能被改变。一个变量或对象在一定的区域内（比如函数内，全局等）只能被定义一次，如果定义多次，编译器会提示你重复定义同一个变量或对象。
什么是声明：有两重含义，如下：
第一重含义：告诉编译器，这个名字已经匹配到一块内存上了(伊人已嫁，吾将何去何从？何以解忧，唯有稀粥)，下面的代码用到变量或对象是在别的地方定义的。声明可以出现多次。
第二重含义：告诉编译器，我这个名字我先预定了，别的地方再也不能用它来作为变量名或对象名。比如你在图书馆自习室的某个座位上放了一本书，表明这个座位已经有人预订，别人再也不允许使用这个座位。其实这个时候你本人并没有坐在这个座位上。这种声明最典型的例子就是函数参数的声明，例如：
void fun(int i, char c);
好，这样一解释，我们可以很清楚的判断:A)是定义；B)是声明。
那他们的区别也很清晰了。记住，定义声明最重要的区别：定义创建了对象并为这个对象分配了内存，声明没有分配内存(一个抱伊人，一个喝稀粥。^_^)。

2、CPU处理数据的过程

数据从内存里拿出来先放到寄存器，然后CPU 再从寄存器里读取数据来处理，处理完后同样把数据通过寄存器存放到内存里，CPU 不直接和内存打交道。

3、static关键字

（1）修饰变量

静态全局变量，作用域仅限于变量被定义的文件中，其他文件即使用extern 声明也没法使用他。准确地说作用域是从定义之处开始，到文件结尾处结束，在定义之处前面的那些代码行也不能使用它。想要使用就得在前面再加extern *。恶心吧？要想不恶心，很简单，直接在文件顶端定义不就得了。

静态局部变量，在函数体里面定义的，就只能在这个函数里用了，同一个文档中的其他函数也用不了。由于被static 修饰的变量总是存在内存的静态区，所以即使这个函数运行结束，这个静态变量的值还是不会被销毁，函数下次使用时仍然能用到这个值。

（2）修饰函数

函数前加static 使得函数成为静态函数。但此处“static”的含义不是指存储方式，而是指对函数的作用域仅局限于本文件(所以又称内部函数)。注意此时, 对于外部(全局)变量, 不论是否有static限制, 它的存储区域都是在静态存储区, 生存期都是全局的. 此时的static只是起作用域限制作用, 限定作用域在本模块(文件)内部.

使用内部函数的好处是：不同的人编写不同的函数时，不用担心自己定义的函数，是否会与其它文件中的函数同名。

4、如何用程序确认当前系统的存储模式

（1）大端模式（Big_endian）：字数据的高字节存储在低地址中，而字数据的低字节则存放在高地址中。

（2）小端模式（Little_endian）：字数据的高字节存储在高地址中，而字数据的低字节则存放在低地址中。

union 型数据所占的空间等于其最大的成员所占的空间。对union 型的成员的存取都是相对于该联合体基地址的偏移量为0 处开始，也就是联合体的访问不论对哪个变量的存取都是从union 的首地址位置开始。

int checkSystem( )  
{  
    union check  
    {  
       int i;  
       char ch;  
    } c;  
    c.i = 1;  
    return (c.ch ==1);  
}

5、文件包含

（1）#include < filename >

其中，filename 为要包含的文件名称，用尖括号括起来，也称为头文件，表示预处理到系统规定的路径中去获得这个文件（即C 编译系统所提供的并存放在指定的子目录下的头文件）。找到文件后，用文件内容替换该语句。

（2）#include “filename”

其中，filename 为要包含的文件名称。双引号表示预处理应在当前目录中查找文件名为filename 的文件，若没有找到，则按系统指定的路径信息，搜索其他目录。找到文件后，用文件内容替换该语句。

特别注意：
由于嵌套包含文件的原因一个头文件可能会被多次包含在一个源文件中条件指示符可防止这种头文件的重复处理。例如：

#ifndef BOOKSTORE_H
#define BOOKSTORE_H 
#endif

条件指示符#ifndef 检查BOOKSTORE_H 在前面是否已经被定义，这里BOOKSTORE_H 是一个预编译器常量，习惯上预编译器常量往往被写成大写字母，如BOOKSTORE_H 在前面没有被定义则条件指示符的值为真于是从#ifndef 到#endif 之间的所有语句都被包含进来进行处理。相反，如果#ifndef 指示符的值为假则它与#endif 指示符之间的行将被忽略。

6、内存对齐

为什么会有内存对齐？

原因在于，8位CPU访问数据一般是一次读取八位，为了访问未对齐的内存，处理器需要作两次内存访问；然而，对齐的内存访问仅需要一次访问。

struct TestStruct1
{
      char c1;
      short s;
      char c2;
      int i;
};

编译器默认将结构、栈中的成员数据进行内存对齐。因此，上面的程序输出就变成了：c1 00000000, s 00000002, c2 00000004, i 00000008。编译器将未对齐的成员向后移，将每一个都成员对齐到自然边界上，从而也导致了整个结构的尺寸变大。尽管会牺牲一点空间（成员之间有部分内存空闲），但提高了性能。也正是这个原因，我们不可以断言sizeof(TestStruct1)的结果为8。在这个例子中，sizeof(TestStruct1)的结果为12。

如何避免内存对齐的影响？

struct TestStruct2
{
       char c1;
       char c2;
       short s;
       int i;
};

这样一来，每个成员都对齐在其自然边界上，从而避免了编译器自动对齐。在这个例子中，sizeof(TestStruct2)的值为8。

7、&a[0]、&a 、a的区别

这里&a[0]和&a 到底有什么区别呢？

a[0]是一个元素，a 是整个数组，虽然&a[0]和&a的值一样，但其意义不一样。前者是数组第一个元素的首地址，而后者是数组的首地址。a 其意义与&a[0]是一样，代表的是数组第一个元素的地址。（最主要的区别体现在 &a+1 和 a+1两者的最后结果）

a作为左值和右值得区别：

简单而言，出现在赋值符“=”右边的就是右值，出现在赋值符“=”左边的就是左值。比如,x=y。
左值：在这个上下文环境中，编译器认为x 的含义是x 所代表的地址。这个地址只有编译器知道，在编译的时候确定，编译器在一个特定的区域保存这个地址，我们完全不必考虑这个地址保存在哪里。
右值：在这个上下文环境中，编译器认为y 的含义是y 所代表的地址里面的数据。这个内容是什么，只有到运行时才知道。

当a 作为右值的时候代表的是什么意思呢？很多书认为是数组的首地址，其实这是非常错误的。a 作为右值时其意义与&a[0]是一样，代表的是数组首元素的首地址，而不是数组的首地址。这是两码事。但是注意，这仅仅是代表，并没有一个地方（这只是简单的这么认为，其具体实现细节不作过多讨论）来存储这个地址，也就是说编译器并没有为数组a分配一块内存来存其地址，这一点就与指针有很大的差别。
a 作为右值，我们清楚了其含义，那作为左值呢？
a 不能作为左值！这个错误几乎每一个学生都犯过。编译器会认为数组名作为左值代表的意思是a 的首元素的首地址，但是这个地址开始的一块内存是一个总体，我们只能访问数组的某个元素而无法把数组当一个总体进行访问。所以我们可以把a[i]当左值，而无法把a当左值。其实我们完全可以把a 当一个普通的变量来看，只不过这个变量内部分为很多小块，我们只能通过分别访问这些小块来达到访问整个变量a 的目的。

8、以指针的形式访问和以下标的形式访问

A)
char *p = “abcdef”;
B)
char a[] = “123456”;

（1）以指针的形式访问和以下标的形式访问指针

例子A)定义了一个指针变量p，p 本身在栈上占4 个byte，p 里存储的是一块内存的首地址。这块内存在静态区，其空间大小为7 个byte，这块内存也没有名字。对这块内存的访问完全是匿名的访问。比如现在需要读取字符‘e’，我们有两种方式：

1）以指针的形式：*(p+4)。先取出p 里存储的地址值，假设为0x0000FF00，然后加上4 个字符的偏移量，得到新的地址0x0000FF04。然后取出0x0000FF04 地址上的值。

2）以下标的形式：p[4]。编译器总是把以下标的形式的操作解析为以指针的形式的操作。p[4]这个操作会被解析成：先取出p 里存储的地址值，然后加上中括号中4 个元素的偏移量，计算出新的地址，然后从新的地址中取出值。也就是说以下标的形式访问在本质上与以指针的形式访问没有区别，只是写法上不同罢了。

（2）以指针的形式访问和以下标的形式访问数组

例子B)定义了一个数组a，a 拥有7 个char 类型的元素，其空间大小为7。数组a 本身在栈上面。对a 的元素的访问必须先根据数组的名字a 找到数组首元素的首地址，然后根据偏移量找到相应的值。这是一种典型的“具名+匿名”访问。比如现在需要读取字符‘5’，我们有两种方式：

1）以指针的形式：*(a+4)。a 这时候代表的是数组首元素的首地址，假设为0x0000FF00，然后加上4 个字符的偏移量，得到新的地址0x0000FF04。然后取出0x0000FF04 地址上的值。

2）以下标的形式：a[4]。编译器总是把以下标的形式的操作解析为以指针的形式的操作。a[4]这个操作会被解析成：a 作为数组首元素的首地址，然后加上中括号中4 个元素的偏移量，计算出新的地址，然后从新的地址中取出值。

另外一个需要强调的是：上面所说的偏移量4 代表的是4 个元素，而不是4 个byte。只不过这里刚好是char 类型数据1 个字符的大小就为1 个byte。记住这个偏移量的单位是元素的个数而不是byte 数，在计算新地址时千万别弄错了。

9、地址的强制转换

(unsigned long)p + 0x1 的值呢？这里涉及到强制转换，将指针变量p 保存的值强制转换成无符号的长整型数。任何数值一旦被强制转换，其类型就改变了。所以这个表达式其实就是一个无符号的长整型数加上另一个整数。所以其值为：0x100001。
(unsigned int* )p + 0x1 的值呢？这里的p 被强制转换成一个指向无符号整型的指针。所以其值为：0x100000+sizof（unsigned int）*0x1，等于0x100004。

10、二维数组在内存中的布局

这里写图片描述

以数组下标的方式来访问其中的某个元素：a[i][j]。编译器总是将二维数组看成是一个
一维数组，而一维数组的每一个元素又都是一个数组。a[3]这个一维数组的三个元素分别为：
a[0],a[1],a[2]。每个元素的大小为sizeof （a[0]）,即sizof(char)*4。由此可以计算出a[0],a[1],a[2]
三个元素的首地址分别为& a[0]，& a[0]+ 1*sizof(char) * 4，& a[0]+ 2*sizof(char) * 4。亦即a[i]的首地址为& a[0]+ i*sizof(char) * 4。这时候再考虑a[i]里面的内容。就本例而言，a[i]内有4个char 类型的元素，其每个元素的首地址分别为&a[i]，&a[i]+1*sizof(char)，&a[i]+2*sizof(char)，&a[i]+3 * sizof(char)，即a [i] [j]的首地址为&a [i] +j*sizof(char)。再把&a[i]的值用a 表示，得到a[i] [j]元素的首地址为：a+i* sizof(char)* 4+ j* sizof(char)。同样，可以换算成以指针的形式表示：* (* (a+i)+j)。