C现代方法(第1&2章)笔记——概述、基本概念

C现代方法笔记(chapter1&2)

序言

0.1 C标准

  • C标准早期有C89,C99(普及),逐渐演化至C11,C18(最新)。
  • 冷知识,C89标准中,标识符只有前6个字符保证有效,而且不一定区分大小写!
  • C99要求每个函数都有一个显式的返回类型。

0.2 现代方法

  • 正确看待C语言
  • 强调C语言的标准版本
  • 揭穿神话
  • 强调软件工程
  • 推迟介绍C语言的底层特性
  • 不再强调“手工优化”

第1章 C语言概述

1.1 C语言的历史

1.1.1 起源
  • C语言是贝尔实验室开发的,是比汇编语言更加高级的一种语言,是B语言升级版的升级版。
  • C语言替代汇编语言重写UNIX系统,改用C语言后程序具有良好的可移植性,只要为贝尔实验室的其它计算机编写C编译器,这些团队就能让UNIX系统也运行在那些机器上。
1.1.2 标准化
  • 1983年,美国国家标准协会(ANSI)开始推动C语言标准制定。1990年,ISO通过ANSI的C标准,将其作为国际标准,也就是C89或者C90。1999通过了C99标准。
  • C语言最近的两次改变分别发生在2011和2018年,这两年分别通过了C11和C18。
  • 从C99到C11再到C18的变化,没有从C89到C99那么显著。尤其是从C11到C18的变化,仅限于技术修饰和澄清,总体上没有显著的改变,也没有引入新的语言特性。
1.1.3 基于C的语言

C语言对现代编程语言有着巨大的影响,许多现代编程语言都借鉴了大量C语言的特性。以下几种非常具有代表性:

  • C++,包括了所有C特性,但增加了类和其他特性以支持面向对象编程。
  • Java,基于C++,因此也继承了C的许多特性。
  • C#,由C++和JAVA发展起来的一种较新的语言。
  • Perl,最初是一种非常简单的脚本语言,在发展过程中采用了C的许多特性。

1.2 C语言的优缺点

  1. C是一种底层语言,C提供了对机器级概念,使得程序可以快速执行。
  2. C是一种小型语言,C很大程度上依赖一个标准函数的“库”。
  3. C是一种包容性语言,有着更高的自由度。
1.2.1 C语言的优点
  • 高效。
  • 可移植性。
  • 功能强大。
  • 灵活。
  • 标准库,C标准库包含了数百个可以用于输入/输出、字符串处理、存储分配以及其他实用操作的函数。
  • 与UNIX系统的集成。
1.2.2 C语言的缺点
  • C程序更容易隐藏错误。
  • C程序可能会难以理解。
  • C程序可能会难以修改。
1.2.3 高效地使用C语言
  • 学习如何规避C语言的缺陷。现代编译器可以检查到常见的缺陷并且发出警告,但是没有一个编译器可以发现全部缺陷。
  • 使用软件工具使程序更加可靠。比如静态编译工具。
  • 利用现有的代码库。
  • 采用一套切合实际的编码规范。
  • 避免“投机取巧”和极度复杂的代码。要遵守简洁但仍然易于理解的编码风格。
  • 紧贴标准。为了程序的可移植性,最好避免使用标准中没有的特性和库函数。

第2章 C语言基本概念

本章介绍了C语言的一些基本概念,包括预处理指令,函数,变量和语句。

2.1 编写一个简单的C程序

/*
显示双关语“To C, or not to C: that is the question.”
*/
//pun.c
#include <stdio.h>

int main(void){
    printf("To C, or not to C: that is the question.\n");
    return 0;
}

接下来对这段代码做简要介绍:

第一行#include <stdio.h>是必不可少的,它包含了C语言标准输入/输出库的相关信息,程序的可执行代码都在main函数中,这个函数代表“主”程序。main函数中的第一行代码是用来显示期望信息的。printf函数来自标准输入/输出库,可以产生完美的格式化输出。代码\n告诉printf函数执行完消息显示后要进行换行操作。第二行代码return 0;表明程序终止时会向操作系统返回值0

2.1.1 编译和链接

为了把程序转换为机器可以执行的形式,通常包括下面3个步骤:

  1. 预处理。首先程序会被交给预处理器(preprocessor)。预处理器执行以#开头的命令(指令)。
  2. 编译。修改后的程序现在可以进入编译器(compiler)了。编译器会把程序翻译成机器指令(目标代码),此时的程序还是不可以运行的。
  3. 链接链接器(linker)把由编译器产生的目标代码和所需的其他附加代码整合在一起,生成完全可执行的程序。这些附加代码包括程序中用到的库函数(如printf函数)。
  • 以上过程往往是自动实现的,因此人们会发现这项工作不是太艰巨,通常预处理器和编译器集成在一起,所以人们甚至可能不会注意它在工作。

GCC,作为最流行的C编译器之一,它随Linux发行,但也有面向其他很多平台的版本。这种编译器的使用与传统的UNIX cc编译器类似。编译程序pun.c可以使用以下命令:

gcc -o pun pun.c

2.1.2 集成开发环境(IDE)

集成开发环境是一个软件包,我们可以在其中编辑、编译、链接、执行甚至调试程序。

2.2 简单程序的一般形式

简单C程序一般具有如下形式:

指令

int main(void){
    语句
}

即使是最简单的C程序也依赖3个关键的语言特性:指令(在编译前修改程序的编辑命令)、函数(被命名的可执行代码块,如main函数)和语句(程序运行时执行的命令)。

2.2.1 指令
  • 比如#include <stdio.h>这条指令说明,在编译前把<stdio.h>中的信息“包含”到程序中。C语言拥有大量类似于<stdio.h>的头(header),每个头都包含一些标准库的内容。C语言不同于其他的编程语言,它没有内置的“读”和“写”命令。输入/输出功能由标准库中的函数实现。
  • 所有指令都是以字符#开始的。这个字符可以把C程序中的指令和其他代码区分开来。指令默认只占一行,每条指令的结尾没有分号或其他特殊标记
2.2.2 函数

事实上,C程序就是函数的集合,函数分为两大类,一类是程序员编写的函数,另一类则是作为C语言实现的一部分提供的函数。后者称为库函数,因为他们属于一个由编译器提供的函数“库”。

  • 在C语言中,函数仅仅是一系列组合在一起并且被赋予了名字的语句。某些函数计算数值并返回,某些函数则不是这样。函数用return语句来指定所“返回”的值。
  • 一个C程序可以包含多个函数,但只有main函数必须有的。
  • return 0;有两个作用,一是使main函数终止,二是指出main函数的返回值是0,表示程序正常终止。
2.2.3 语句

语句是程序运行时执行的命令。

  • pun.c就用了返回语句和函数调用语句。
  • C语言规定每条语句都要以分号结尾。指令不需要分号结尾
2.2.4 显示字符串
  • 字面串(string literal)————用一对双引号包围的一系列字符。当用printf函数显示字面串时,最外层的双引号不会出现。
  • \n表示换行。

2.3 注释

每一个程序都应该包含识别信息,即程序名、编写日期、作者、程序的用途以及其他相关信息。

  • 符号/*标记注释的开始,*/标记注释的结束。
  • 简短的注释可以和程序中的其他代码放在同一行(翼型注释)。
  • C99标准提供了另一种类型的注释,以//开始。
  • 作为一种新的注释风格,//有两个主要优点:首先,因为注释会在行末自动终止,所以不会出现未终止的注释意外吞噬部分程序的情况;其次,因为每行注释前面都必须有//,所以多行注释看上去更加醒目。

2.4 变量和赋值

大多数程序在产生输出之前往往需要执行一系列的计算,因此需要在程序执行过程中有一种临时存储数据的方法,C语言中的这类存储单元被称为变量

2.4.1 类型
  • 每个变量都必须有一个类型。
  • 类型会影响变量的存储方式以及允许对变量进行的操作。
  • 数值型变量的类型决定了变量所能存储的最大值和最小值,同时也决定了是否允许在小数点后出现数字。
  • 进行运算时,float型变量通常比int型变量慢。
  • float型变量所存储的数值往往只是实际数值的一个近似值。比如在一个float型变量中存储0.1,以后可能会发现变量的值为0.099 999 999 999 999 87,这是舍入造成的误差。
2.4.2 声明

在使用变量之前必须对其进行声明(为编译器所做的描述)。为了声明变量,首先要指定变量的类型,然后说明变量的名字。

  • 比如,int height;说明height是一个int型变量,这意味着变量height可以存储一个整数值。
  • 如果几个变量具有相同的的类型,就可以把它们的声明合并,例如float profit,loss;,注意每一条完整的声明都要以分号结尾。
  • main函数包含声明时,必须把声明放置在语句之前。
int main(void){
    声明
    语句
}
  • 就书写格式而言,建议在声明和语句之间留出一个空行。
  • C99标准中,声明可以不在语句之前。例如,main函数中可以先有一个声明,后面跟一条语句,然后再跟一个声明。
2.4.3 赋值

变量通过赋值(assignment)的方式获得值。

height = 8;
length = 12;
width = 10;
  • 把数值81210分别赋值给变量heightlengthwidth,其中8、12和10称为常量(constant)
  • 变量在赋值或以其它方式使用之前必须先声明。
  • 当我们把一个包含小数点的常量赋值给float型变量时,最好在该常量后面加一个字母f(代表float)。比如profit = 21.34f,不加f可能触发编译器的警告。
  • 一般情况下,赋值运算的右侧可以是一个含有常量、变量和运算符的公式。(C语言的术语中称为表达式
2.4.4 显示变量的值
  • printf("height: %d\n", height);

    1. 占位符%d用来指明在显示过程中变量height的值的显示位置。
    2. %d仅用于int型变量。%f则显示float型变量。
  • 默认情况下,%f会显示出小数点后6位数字。如果要强制%f显示小数点后p位数字,可以把p放置在%f之间。比如printf("Profit: $%.2f\n", profit)

  • C语言没有限制调用一次printf可以显示的变量数量。

2.4.5 初始化

当程序开始执行时,某些变量会被自动设置为0(static类型),而大多数变量则不会(auto类型)。没有默认值并且尚未在程序中被赋值的变量是未初始化的。

  • 在声明变量的同时给变量赋值。
  • int height, length, width = 10这个例子中,只有变量width拥有初始化器10,而前面两个变量没有(两个变量没有初始化)。
2.4.6 显示表达式的值
  • 比如,printf("%d\n", height * length * width);

printf显示表达式的值的能力说明了C语言的一个通用原则:在任何需要数值的地方,都可以使用具有相同类型的表达式

2.5 读入输入

scanfprintf中的字母f都表示“格式化”的意思。两个函数都需要使用格式串(format string)来指定输入数据或输出数据的形式。

scanf函数需要知道将获得的输入数据的格式,而printf函数需要知道输出数据的显示格式

  • 为了读入一个int型值,可以使用下面的scanf函数调用:
scanf("%d", &i);
/*
字符串“%d”说明scanf读入的是一个整数,而i是一个int型变量,用来存储scanf读入的输入。

读入一个float型值时,需要一个形式略有不同的scanf调用。
*/
scanf("%f", &x);
  • 提示用户输入的消息(提示符)通常不应该以换行结束,因为我们希望用户在同一行输入。这样,当用户敲回车键时,光标会自动移动到下一行。因此就不需要程序通过显示换行符来终止当前行了。

2.6 定义常量的名字

  • 当程序含有常量时,建议给这些常量命名。
  • 可以采用宏定义的特性给常量命名:#define INCHES_PER_POUND 166,这里的#define预处理指令,此行的结尾也没有分号。
  • 编译时,预处理器会把每一个宏替换为其表示的值。
  • 此外,可以使用宏来定义表达式:define RECIPROCAL_OF_PI (1.0f / 3.14159f),当宏包括运算符时,建议使用括号把表达式括起来。

注意,宏的名字只用了大写字母。这是大多数C程序员遵循的规范,并不是C语言本身的要求。

2.7 标识符

在编写程序时,需要对变量、函数、宏和其他实体进行命名。这些名字称为标识符

  • 在C语言中,标识符可以含有字母、数字和下划线,但是必须以字母或者下划线开头。比如,times10 get_next_char _done这三个是合法的,而10times get-next-char这两个是不合法的。
  • C语言是区分大小写的,所以许多程序员会遵循在标识符中只使用小写字母的规范(宏命名除外)。为了使名字清晰,必要是还会插入下划线。而另外一些程序员则避免使用下划线,他们的方法是把标识符中的每个单词用大写字母开头:symbolTable currentPage nameAndAddress
  • C对标识符的最大长度没有限制,因此不要担心使用较长的描述性名字。

关键字,对C编译器而言都有着特殊的意义,因此关键字不能作为标识符来使用。

2.8 C程序的书写规范

  • 语句可以分开放在任意多行内。
  • 记号间的空格使我们更容易区分记号。基于这个原因,我们通常会在每个运算符的前后都放上一个空格:volume = height * length * width;
  • 此外,还会在每个逗号后边放一个空格。某些程序员甚至在圆括号和其他标点符号的两边都加上空格。
  • 缩进有助于轻松识别程序嵌套。例如,为了清晰的表示出声明和语句都嵌套在main函数中,应该对他们进行缩进。
  • 空行可以把程序划分成逻辑单元,从而使读者更容易辨别程序的结构。没有空行的程序很难阅读,就像不分章节的书一样。
  • 把字符串从一行延续到下一行需要一种特殊的方法才可以实现,后面的章节将会讲到。

问与答

问1:GCC是什么的简称?

答:GCC最初是GNU C Compiler的简称,现在指GNU Compiler Collection,这是因为最新版本的GCC能够编译用Ada、C、C++、Fortran、Java 和Objective-C等多种语言编写的程序。

问2:明白了,但GNU又是什么意思呢?

答:GNU指的是“GNU’s Not UNIX!”(发音为guh-NEW),它是自由软件基金会(Free Software Foundation)的一个项目。自由软件基金会是由Richard M. Stallman发起的一个组织,旨在抗议对UNIX 软件授权的各种限制。从它的网站可以看出,自由软件基金会认为用户应该可以自由地“运行、复制、发布、研究、改变和改进”软件。GNU 项目从头开始重写了许多传统的UNIX 软件,并使公众能够免费地获得。
GCC 和其他GNU软件对于Linux操作系统来说是至关重要的。Linux本身只是操作系统的“内核”
(处理程序调度和基本输入/输出服务的部分),为了获得具备完整功能的操作系统,GNU 软件是必要的。

问3:GCC发现程序中错误的能力如何?

答:GCC有多个命令行选项来控制程序检查的彻底程度。使用这些选项可以帮助我们有效地找出程序中潜在的故障区域。下面是一些比较常用的选项。

  • –Wall :使编译器在检测到可能的错误时生成警告消息。(–W后面可以加上具体的警告代码,-Wall表示“所有的–W选项”。)为了获得最好的效果,该选项应与–O选项结合使用。

  • –W :除了–Wall生成的警告消息外,还需要针对具体情况的额外警告消息。

  • –pedantic :根据C标准的要求生成警告消息。这样可以避免在程序中使用非标准特性。

  • –ansi :禁用GCC的非标准C特性,并启用一些不太常用的标准特性。

  • –std=c89–std=c99指明使用哪个版本的C编译器来检查程序。这些选项常常可以结合使用:

    % gcc –O –Wall –W –pedantic –std=c99 –o pun pun.c

问4:为什么C语言如此简明扼要?如果在C语言中用beginend代替{},用integer代替int,等等,程序似乎更加易读。

答:据说,C程序的简洁性是由开发该语言时贝尔实验室的环境造成的。第一个C语言编译器是运行在DEC PDP-11计算机(一种早期的小型计算机)上的,而程序员用电传打字机(实际上是一种与计算机相连的打字机)输入程序和打印列表。因为电传打字机的速度非常慢(每秒钟只能打出10 个字符),所以在程序中尽量减少字符数量显然是十分有利的。

问5:在某些C语言书中,main函数的结尾使用的是exit(0)而不是return 0,二者是否一样呢?

答:当出现在main函数中时,这两种语句是完全等价的:二者都终止程序执行,并且向操作系统返回0值。使用哪种语句完全依据个人喜好而定。

问6:如果main函数末尾没有return语句会产生什么后果?

答:return语句不是必需的;如果没有return语句,程序一样会终止。在C89中,返回给操作系统的值是未定义的。在C99中,如果main函数声明中的返回类型是int(如我们的例子所示),程序会向操作系统返回0;否则程序会返回一个不确定的值。

问7:编译器是完全移除注释还是用空格替换注释呢?

答:一些早期的编译器会删除每条注释中的所有字符,使得语句

a/**/b = 0;

可能被编译器理解成

ab = 0;

然而,依据C标准,编译器必须用一个空格字符替换每条注释语句,因此上面提到的技巧并不可行。我们实际上会得到下面的语句:
a b = 0;

问8:如何发现程序中未终止的注释?

答:如果运气好的话,程序将无法通过编译,因为这样的注释会导致程序非法。如果程序可以通过编译,也有几种方法可以用。通过用调试器逐行地执行程序,就会发现是否有些行被跳过了。某些集成开发环境会使用特别的颜色把注释和其他代码区分开来。如果你使用的是这样的开发环境,就很容易发现未终止的注释,因为误把程序文本包含到注释中会导致颜色不同。此外,诸如lint( 1.2 节)之类的程序也可以提供帮助。

问9:在一个注释中嵌套另一个注释是否合法?

答:传统风格的注释(/*…*/)不允许嵌套。例如,下面的代码就是不合法的:

/* 
    /*** WRONG ***/ 
*/
  • 第2行的符号*/会和第1行的/*相匹配,所以编译器会把第3行的*/标记为一个错误。

  • C语言禁止注释嵌套有些时候也是个问题。假设我们编写了一个很长的程序,其中包含了许多短小的注释。为了临时屏蔽程序的某些部分(比如在测试过程中),我们首先会想到用/**/“注释掉”相应的程序行。但是,如果这些代码行中包含有传统风格的注释,这种方法就行不通了。不过,C99注释(以//开始的注释)可以嵌套在传统风格的注释中,这是这类注释的另一个优势。

    后面我们将看到,可以用一种更好的方法来屏蔽部分程序( 14.4 节)。

问10:float 类型的名字由何而来?

答:floatfloating-point的缩写形式,它是一种存储数的方法,而这些数中的小数点是“浮动的”。float类型的值通常分成两部分存储:小数部分(或者称为尾数部分)和指数部分。例如,12.0这个数可以以1.5×2^3的形式存储,其中1.5是小数部分,而3是指数部分。有些编程语言把这种类型称为real类型而不是float类型。

问11:为什么浮点常量需要以字母f结尾?

答:完整的解释见第7章。这里只简单回答一下:包含小数点但不以f结尾的常量是doubledouble precision的缩写)型的。double型的值比float型的值存储得更精确,并且可以比float型的值大,因此在给float型变量赋值时需要加上字母f。如果不加f,编译器可能会生成一条警告消息,告诉你存储到float型变量中的数可能超出了该变量的取值范围。

问12:对标识符的长度真的没有限制吗?

答:是,又不是。C89标准声称标识符可以是任意长,但只要求编译器记住前31个字符( C99中是63个字符)。因此,如果两个名字的前31个字符都相同,编译器可能会无法区分它们。

更复杂的情况是,C标准对于具有外部链接(18.2节)的标识符有特殊的规定,而大多数函数名属于这类标识符。因为链接器必须能识别这些名字,而一些早期的链接器又只能处理短名字,所以在C89中标识符只有前6个字符才是有效的。此外,C89还不区分字母的大小写。因此ABCDEFGabcdefg可能会被作为相同的名字处理。(C99中,前31个字符有效,且字母区分大小写。

大多数编译器和链接器比标准所要求的更宽松,因此实际使用中这些规则都不是问题。不要担心标识符太长,还是注意不要把它们定义得太短吧。

问13:缩进时应该使用多少空格?

答:这是个难以回答的问题。如果预留的空间过少,会不易察觉到缩进;如果预留的空间太多,则可能会导致行宽超出屏幕(或页面)的宽度。许多C程序员采用8个空格(即一个制表键)来缩进嵌套语句,这可能太多了。研究表明,缩进3个空格是最合适的,但许多程序员不太习惯于非2的幂次。我习惯于缩进3或4个空格,但是考虑到页面的需要,本书采用了2 个空格的缩进方式。

总结

本文章为之前两次笔记的补充,欢迎各位大佬阅读学习,有不对的地方还请指正,不胜感激。后续章节笔记会持续更新,敬请期待!(书名:《C语言程序设计:现代方法(第2版·修订版)》)

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

New_Teen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值