C语言深度解剖读书笔记(1.关键字的秘密)

最新推荐文章于 2024-02-11 13:09:48 发布

原创最新推荐文章于 2024-02-11 13:09:48 发布 · 2.2w 阅读

182 ·

CC 4.0 BY-SA版权

c语言深度解析读书笔记陈正冲同时被 2 个专栏收录

10 篇文章

订阅专栏

c语言深度解析

10 篇文章

订阅专栏

开始本节学习笔记之前，先说几句题外话。其实对于C语言深度解剖这本书来说，看完了有一段时间了，一直没有时间来写这篇博客。正巧还刚刚看完了国嵌唐老师的C语言视频，觉得两者是异曲同工，所以就把两者一起记录下来。等更新完这七章的学习笔记，再打算粗略的看看剩下的一些C语言的书籍。

本节知识：

1. c语言中一共有32个关键字，分别是：auto、int、double、long、char、short、float、unsigned、signed、sizeof、extern、static、goto、if、else、struct、typedef、union、enum、switch、case、break、default、do、while、const、register、volatile、return、void、for、continue。注意：define、include这些带#号的都不是关键字，是预处理指令。

2. 定义与声明：

定义是创建一个对象并为止分配内存。如：int a;

声明是告诉编译器在程序中有这么一个对象，并没有分配内存。如： extern int a;

3.对于 register这个关键字定义的变量，不能进行取地址运算(&)，因为对于x86架构来说，地址都是在内存中的，不是在寄存器中的，所以对寄存器进行取地址是没有意义的。并且应该注意的是给register定义的变量，应该赋一个比寄存器大小要小的值。注意：register只是请求寄存器变量，但是不一定申请成功。

4. 关键字static：

对于static有两种用法：

a.修饰变量：对于静态全局变量和静态局部变量，都有一个特点就是不能被作用域外面，或外文件调用(即使是使用了extern也没用)。原因就是它是存储在静态存储区中的。对于函数中的静态局部变量还有一个问题，就是它是存在静态存储区的，即使函数结束栈区收回，这个变量的值也不改变。static int i=0; 这是一条初始化语句而不是一条赋值语句所以跟i=0不一样的。

b.修饰函数：是定义为静态函数，使函数只能在文件内部使用，这样不同文件中的函数名就不怕重名了。原因也是相同的，就是static修饰的一切都是在静态存储区中的。

static代码如下：

#include <stdio.h>
#include <stdlib.h>

int main(void) 
{
	static int j=0;
	int k;
	void fun1()
	{
		j=0;
		j++;
		printf("fun1 %d\n",j);
	}
	void fun2()
	{

		static int i=0;
		//i=0;
		printf("fun2 %d\n",i);
		i++;
	}
	for(k=0;k<10;k++)
	{
			fun1();
			fun2();
	} 
	return 1;  
}

5. 关键字sizeof：

怎么说明sizeof是关键字不是函数，这里有两个例子：

a. int i; printf("%d\n",sizeof i); 可见 sizeof是关键字

b. sizeof(fun()); 不调用fun函数因为 sizeof是在预编译期间完成的说明是关键字

sizeof的代码：

#include <stdio.h>
#include <stdlib.h>

void fun(int b[100])
{
	printf("sizeof(b) is %d\n",sizeof(b));
}

int main(void) 
{
	int *p=NULL;
	int a[100];
	int b[100];
	printf("sizeof(p) is %d\n",sizeof(p));
	printf("sizeof(*p) is %d\n",sizeof(*p));
	printf("sizeof(a[100]) is %d\n",sizeof(a[100]));
	printf("sizeof(a) is %d\n",sizeof(a));
	printf("sizeof(&a) is %d\n",sizeof(&a));
	printf("sizeof(&a[0] is %d\n",sizeof(&a[0]));
	
	fun(b);
	return 1;
}

6. 关键字if：
a.对于bool类型的比较：FLASE都是0 TRUE不一定是1 所以应该用if(bool_num); if(!bool_num);

对于浮点型与0比较要是否注意：不能直接比较，要定义精度，其实浮点型与浮点型比较也要注意这个问题，就是不能直接比较，要设定精度，如图：

原因跟浮点型的存储格式有关，因为float的有效位是6位，超出6位就未知了，所以不能直接进行比较。同样的原因，也不能用一个很大的浮点数去加一个很小的浮点数。这个加法可能体现不出来。

b.对于if后面的分号问题，一定要注意，会被解析成if后面有一个空语句，所以使用空语句的时候最好使用NULL;

c.在使用if else的时候，应该if里面先处理正常情况(出现概率大的情况)，else里面处理异常情况，这是一个好习惯看着代码舒服。

7. 关键字switch、case：

注意case后面应该是整型或者字符型的常量及常量表达式，case后面最好是应该安装字母或数字顺序排列，先处理正常情况，后处理异常情况。

8. 关键字void：

void *的一般用途是，接收任何类型的指针，如当传入函数的指针类型不确定的时候，一般用 void*接收任何类型的指针。

void* 指针作为右值赋值给其他指针的时候一定要强制类型转换，因为void* 指针类型不定。

GNU中void *p p++跟char *p p++是一样的。

注意：strcpy跟memcpy的区别就是 strcpy是char * memcpy是void * 。 所以说strcpy是给字符串赋值，memset是给整块内存赋值。

9. 关键字extern：

extern就有两种用法：一种是声明外部定义的变量或函数、另一种是extern c告诉编译器以标准c语言方式编译

10. 关键字return：

使用return的时候，要注意不能返回栈内指针，因为在函数体结束后，栈是会被收回的，其实是不能期望返回一个指针，来返回一块内存。因为返回一个指针或者地址没有问题，因为return是copy然后返回的，但是那个指针指向的内存如果是在函数栈中的话，就很有可能在函数结束后被收回了！！！

return ; 一般返回的值是1，根据编译器而定。

11. 关键字const：

a.const是用来定义只读变量的，切忌它定义的是变量，不是常量，真的常量是#define的和enum。

b.在陈正冲老师的这本书中的第35页，有说编译器不为普通const只读变量分配内存空间，而是将它们保存在符号表中，这使得它成为一个编译期间的值，没有了存储与读内存的操作，使得它的效率也很高，节省空间。具体的没怎么看懂，本次学习也不打算看懂了(因为它说const修饰的全局只读变量是在静态区的，我太认同)~~~嘿嘿

c.其实const就是修饰变量，然后这个变量就不能当作左值了，当作左值，编译器就报错！！！

d. 其实const中最不好区分的知识点是，如图：

其实对于这四个情况的记忆很简单，就是看const跟谁近，是const *p ，还是 * const p，还是const * const p，这样就很容易看出来const是修饰谁的了吧。

e.但是const修饰的变量可以通过，指针将其改变。

f.const修饰函数参数表示在函数体内不希望改变参数的值，比如说在strcmp等函数中，用的都是const char*

g.const修饰函数返回值表示返回值不可以改变，多用于返回指针的情况：

cosnt int* func()
{
      static int  count  =  0;
      count++;
      return &count;
}

h.在看const修饰谁，谁不变的问题上，可以把类型去掉再看，代码如下：

struct student
{
		
}*str;
const str stu3;
str const stu4;

str是一个类型，所以在去掉类型的时候，应该都变成const stu3和const stu4了，所以说应该是stu4和stu3这个指针不能被赋值。
12.关键字volatile：
volatile搞嵌入式的，一定都特别属性这个关键字，记得第一使用这个关键字的时候是在韦东山老师的，Arm裸机视频的时候。volatile是告诉编译不要对这个变量进行任何优化，直接在内存中进行取值。一般用在对寄存器进行赋值的时候，或修饰可能被多个线程访问的变量。

注意：const volatile int i；应该是定义了一个只读寄存器。

13. 关键字struct：

a.对于空结构体的大小问题，vc和gcc的输出是不一样的，vc是1 、gcc是0 ，而且vc对于结构体的定义也和gcc不一样，vc中有c++的标准扩展了struct的作用，而gcc中是纯c的标准，就是按照标准c语言来的。

b.struct这里还有一个很有用的东西，就是柔性数组，这个东西很有意思，我已经在数据结构的静态链表中进行了阐述，这里就仅仅记录一下，不详细说明了。

14. 关键字union：

union有一个作用就是判断，pc是大端存储还是小端存储的，x86是小端存储的，这个东西是有cpu决定的。arm(由存储器控制器决定)和x86一样都是小端的。

下面的是一个大端小端的一个例子，代码如下：

#include <stdio.h>
#include <stdlib.h>
int main(void) 
{
	int a[5]={1,2,3,4,5};
	int *p=(int *)(&a+1);  //数组指针 加一  进行正常的指针运算 走到数

组尾 
	int *d=(int *)((int)a+1);//地址加一  不是指针运算
	//printf("%x\n",*((char *)((int)a+1)-1));
	 
	/*因为是小端存储  高地址  0x00  0x00  0x00  0x02  0x00  0x00  0x00  0x01 低地址*/
	/*变成了 0x02  0x00  0x00  0x00 */ 
	printf("%x,%x",p[-1],*d);  /*  第二个值就是这么存储的0x02  0x00  0x00  0x00  低地址处  所以就是2000000*/
	int a=0x11223344;
	char *p=(char *)((int)&a);
	printf("%x\n%x\n",*(p+0),p+0); 
	printf("%x\n%x\n",*(p+1),p+1);
	return 0;
}

下面是一个利用union判断PC是大端小端的例子，代码如下：

#include <stdio.h>
#include <stdlib.h>
union
{
	int i;
	char a[2];
}*p,u;

int main(void) 
{
	p=&u;
	p->i=0x3839;
	printf("%x\n",p->i);
	printf("a0p=%x,a1p=%x\n",&(p->a[0]),&(p->a[1]));
	printf("a0=%x,a1=%x\n",p->a[0],p->a[1]);	
	return 0;
}

15. enum关键字：
枚举enum其实就是 int类型，用来保存枚举常量的。enum枚举类型，这个才是真正的常量，定义常量一般用enum 。#define是宏定义是在预编译期间单纯的替换。#define宏定义无法调试，枚举常量是可以调试的。#define宏定义是无类型信息的，枚举类型是有类型信息的常量，是int型的。

16. typedef关键字：
a.typedef用于给一个已经存在的数据类型重新命名。

b.typedef并没有产生新的数据类型

c. typedef重定义的类型不能进行unsigned和signed进行扩展

原因在于typedef 定义新类型的时候应该定义全了，unsigned int是一个类型不能拆开的。

typedef  unsigned  int   int32;

d.typedef 和 #define的区别：typedef是给已有的类型取别名，而#define只是简单的字符替换。区别如下图：

#define PCHAR char* PCHAR p3，p4; //p3是char*型 p4是char型
typedef char* PCHAR; PCHAR p1,p2; //p1和p2都是 char*型
e.有一个知识点忘记了，嘿嘿，程序如下：

typedef struct student
{
}str，*str1;

str1 abc; 就是定义一个struct student *类型
str abc; 就是定义一个struct student 类型

f.对于const和typedef还有两个问题遗漏了，在 < c++学习笔记(1.c到c++的升级)>这篇文章中的最后 (8.补充) 中进行了阐述。

17. 关键字for：

a.长循环应该在最内层，这样可以减少各个层直接的切换

b.看看如下两段代码有什么区别：

程序一：
for(i=0; i<m; i++)
{
    for(j=0; j<n; j++)
    {
        for(k=0; k<p; k++)
        {
            c[i][j] = a[i][k] * b[k][j];
        }
    }
}

程序二：
for(i=0; i<m; i++)
{
    for(k=0; k<p; k++)
    {
        for(j=0; j<n; j++)
        {
            c[i][j] = a[i][k] * b[k][j];
        }
    }
}

从程序来看，两者实现了同样的功能，区别只是第二层和第三层循环交换了位置。但是他们的差距却是巨大的，这个需要从CPU的cache来说了， cpu每次访问内存的时候都会先从内存将数据读入cache ，然后以后都从cache取数据。但是cache的大小是有限的，因此只会有部分进入cache。我们来看这个程序 c[i][j] = a[i][k] * b[k][j]; 我们都知道C中二维数组是在内存中一维排列的，如果我们把k循环放在第三层，那么cache基本没有用了，每次都需要重新到内存取数据，交换后每次取到cache的数据都可以复用多次。所以说第二种写法效率高。

18. 关键字char(本节最重要的知识点char越界的问题)：

对于char有两种类型，分别是：unsigned char(范围是0~255)和 signed char(范围是-128~127) 一个是有符号的，一个是没有符号的。

在计算机中数据都是以数据的补码形式进行存储的，所以如图：

对于无符号类型(unsigned int)：就是不考虑最高位的问题，都是原码与补码相等的情况。

然后我们说说越界的问题，对于一个unsigned char i; 我们给 i = 256；这很明显越界了，i是0到255的，那256的补码是什么再在它补码中取低八位就是i的值了。256的补码是1 0000 0000，所以printf ("%d\n",i);的值会是0。如果i = -1；-1的补码是1111 1111 所以会打印出255。

对于一个char类型的越界又是什么样的呢？

char i; 我们给 i = 129； 129是一个正数，它的补码就是原码：是1000 0001，但是它是char型，在char型中1000 0001是什么，如图是-127。所以printf("%d\n",i); 得到的是-127。如果i = -129，它的补码是0111 1111，所以它打印出来的是127。如果是i = 259，我们就把它的补码取低八位来看。259的补码是1 0000 0011 所以说打印出来的是3。最后一个例子，如果i = 385，它的补码是1 1000 0001 ，取低八位是1000 0001，所以打印的应该是-127。

其实不管是有符号的还是没符号的，原则就一个，把数据转换成为补码，取低八位，然后在上面的图中去比较，就ok了。

给一个练习，代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main()
{
	char a[1000];
	int i;
	for(i=0; i<1000; i++)
	{
		a[i] = (-1-i);
	}	
         while(a[i])
	{
	 	printf("%d\n",a[i]);
		i++;
	}
	printf("%d\n",strlen(a));
	return 0;
}

打印结构是什么：答案是255 分析步骤跟上面是一样的，自己算算吧！！！

其实int的越界原理跟char是一样的。

19.一个关于tab键的问题：

不同编辑器的tab键的字符数是不一样的，一般是4个字符，也有两个字节的，要注意一下，为了代码格式的整齐，建议设置一下tab或者使用空格。

本节遗留问题：

1.printf的实现问题，其实就是可变参数的问题，看linux源码，还有一个问题就是转移字符的问题，char p = '\'' 这样一个问题。

2.浮点型的存储格式，为什么有效位是6位，小数是怎么保存的。

10 条评论

461408865 2013.09.15
谢谢

xiahouzuoxin 2013.09.10
又现一牛人，整理得非常好

zhangjianli_120 2013.09.09
写的很好，值得一看。

EtherXiaoXin 2013.09.09
总结的不错，赞个

剑客闯天涯 2013.09.08
学习了

xueda120 2013.09.07
总结很好，很适合初学者学习

hsc456 2013.09.07
不错不错, 收获很多

FubaoZheng 2013.09.05
很不错，就关注，希望能看到敢于函数与指针方面的指点，函数参数一直弄不明白。谢谢！
- qq418674358回复FubaoZheng 2013.09.06
  [reply]fb2058[/reply] 您可以看看我的这篇文章http://blog.csdn.net/mbh_1991/article/details/10549725