目录
Python
Python 的作者 Guido von Rossum 是荷兰人。1982 年,Guido 从阿姆斯特丹大学获得了数学和计算机硕士学位。然而,尽管他算得上是一位数学家,但他更加享受计算机带来的乐趣。用他的话说,尽管拥有数学和计算机双料资质,他总趋向于做计算机相关的工作,并热衷于做任何和编程相关的活儿。
在 80 年代,虽然 IBM 和 Apple 已经掀起了个人电脑浪潮,但当时的个人电脑的配置很低。比如早期的 Macintosh 只有 8MHz 的 CPU 主频和 128KB 的 RAM,一个稍大的数组就能占满内存。在那个时代,程序员恨不得用手榨取计算机每一寸的能力,甚至有人认为 C 语言的指针是在浪费内存。为了增进效率,编程语言也迫使程序员像计算机一样思考,以便能写出更符合机器口味的程序。
这种编程方式让 Guido 感到苦恼。1989 年,为了打发圣诞节假期,Guido 开始编写 Python 语言的编译器。Python 这个名字,来自 Guido 所挚爱的电视剧 Monty Python’s Flying Circus。他希望这个新的叫做 Python 的语言,能符合他的理想:创造一种介于 C 和 Shell 之间,功能全面,易学易用,可拓展的语言。
1991 年,第一个 Python 编译器诞生。它是用 C 语言实现的,并能够调用 C 语言的库文件。从一出生,Python 已经具有了:类,函数,异常处理、包含列表和字典在内的核心数据类型,以及模块为基础的拓展系统。
Python 的语法很多来自于 C,但又受到 ABC 语言的强烈影响。来自 ABC 语言的一些规定直到今天还富有争议,比如强制缩进。但不得不说从 ABC 借鉴的这些语法规定让 Python 更容易阅读。另一方面,Python 聪明的选择了服从一些常规的惯例,特别是 C 语言的惯例,比如回归等号赋值。Guido 认为,如果 “常识” 上确立的东西,没有必要过度纠结。
Python 从一开始就特别在意可拓展性。Python 可以在多个层次上进行拓展。从高层上,你可以直接引入 .py 文件。在底层,你可以引用 C 语言的库。Python 程序员可以快速的使用 Python 写 .py 文件作为拓展模块。但当性能是考虑的重要因素时,Python 程序员可以深入底层,写 C 的程序,编译为 .so 文件引入到 Python 中使用。
Python 就好像是使用钢构建房一样,先规定好大的框架。而程序员可以在此框架下相当自由的拓展或更改。Python 将许多机器层面上的细节隐藏,交给编译器处理,并凸显出逻辑层面的编程思考。Python 程序员可以花更多的时间用于思考程序的逻辑,而不是具体的实现细节。这一特征吸引了广大的程序员。Python 开始流行。
在整个 90 年代,由于计算机性能的提高,软件的世界也开始随之改变。硬件足以满足许多个人电脑的需要。硬件厂商甚至渴望高需求软件的出现,以带动硬件的更新换代。C++ 和 Java 相继流行。C++ 和 Java 提供了面向对象的编程范式,以及丰富的对象库。在牺牲了一定的性能的代价下,C++ 和 Java 大大提高了程序的产量。语言的易用性被提到一个新的高度。
硬件性能已经不是瓶颈,Python 又容易使用,使得 Python 的用户来自许多领域,有不同的背景,对 Python 也有不同的需求。Python 相当的开放,又容易拓展,所以当用户不满足于现有功能,很容易对 Python 进行拓展或改造。随后,这些用户将改动发给 Guido,并由 Guido 决定是否将新的特征加入到 Python 或者标准库中。如果代码能被纳入 Python 自身或者标准库,这将极大的荣誉。由于 Guido 至高无上的决定权,他因此被称为 “终身的仁慈独裁者”。
Python 被称为 “Battery Included”,是说它以及其标准库的功能强大,这是整个社区的贡献。Python 的开发者来自不同领域,他们将不同领域的优点带给 Python。比如 Python 标准库中的正则表达是参考 Perl,而 Lambda, Map, Filter, Reduce 等函数编程方式参考了 Lisp。Python 本身的一些功能以及大部分的标准库来自于社区。Python 的社区不断扩大,进而拥有了自己的 newsgroup,网站,以及基金。从 Python 2.0 开始,Python 也从 maillist 的开发方式,转为完全开源的开发方式。社区气氛已经形成,工作被整个社区分担,Python 也获得了更加高速的发展。
到今天,Python 的框架已经确立。Python 语言以对象为核心组织代码,支持多种编程范式,采用动态类型,自动进行内存回收。Python 支持解释运行,并能调用 C 库进行拓展。Python 有强大的标准库。由于标准库的体系已经稳定,所以 Python 的生态系统开始拓展到第三方包。这些包,如 Django、web.py、wxpython、numpy、matplotlib、PIL,将 Python 升级成了物种丰富的热带雨林。
在 Python 的开发过程中,社区起到了重要的作用。Guido 自认为自己不是全能型的程序员,所以他只负责制订框架。如果问题太复杂,他会选择绕过去,也就是 Cut The Corner。这些问题最终由社区中的其他人解决。社区中的人才是异常丰富的,就连创建网站,筹集基金这样与开发稍远的事情,也有人乐意于处理。如今的项目开发越来越复杂,越来越庞大,合作以及开放的心态成为项目最终成功的关键。
编译 or 解释?
编译、解释都是指将(与人类亲和的)编程语言翻译成(计算机能够理解的)机器语言(Machine code)的过程。而两者的区别就在于「翻译时机」的不同,看一个例子:
没错,编译型语言会将全部源代码一次性翻译完成,最终得到可执行文件,所以其主要特征就是「一次编译,多次执行」。编译型程序的优势在于运行效率奇高,毕竟可执行文件就是一连串可以被计算机直接执行机器指令集。而缺点在于,可移植性差(异构平台的 CPU 指令集不兼容)、大型应用的编译时间较长、而且每次修改源码都要重新编译,所以 Debug 体验糟糕,不易使用。典型的编译型语言有 C/C++,常见于偏底层,执行环境苛刻且追求速度的场景(e.g. 嵌入式、硬件开发、矿工);
相对的,解释型语言并不会直接将源码翻译成机器码,而是先编译成中间码,再交由语言自身提供的解释器逐条解释执行,所以解释型语言的主要特征之一就是「边解释,边执行」。由此可见,解释型程序的运行效率会更低一些。而解释器存在的目的是为了提供一个与平台无关的托管运行时环境,使同一个解释型程序能够运行在不同的操作系统之上,这就是解释型型语言的另一大特征「跨平台」。
需要注意的是,Python 因为含有解释器,所以经常会被认作解释型语言。实际上这一论断并不严谨,因为 Python 程序的运行同样需要经历编译的过程。Python 自身也包含了编译器,它会将源码先编译为中间状态的字节码(Bytecode),再由解释器进行解释。如果可以的话,Python 会将这些字节码保存在临时文件 .pyc 中,以避免重复无谓的编译。当然,如果源码被修改了,则需要重新编译,直到下一次修改为止。
这样做的原因无非是为了能够在支持跨平台的基础上进一步提升程序的运行效率,也正因如此使 Python 模糊了编译和解释的界限。如果单纯的将 Python 定性为解释型语言,难免会造成理解上的缺失。比如,不了解 .pyc 文件存在的意义。
所以,我更愿意将 Python 定义为一门既有编译又有解释的、相对于 C 语言而言更高级的编程语言。
动态语言 or 静态语言?
动态、静态指的是编程语言的类型系统对数据类型检查的严格程度。在静态类型语言中,类型检查发生在编译阶段(Compile time),然而,在动态类型语言中,类型检查发生在运行阶段(Run time)。
静态类型语言属于严格数据类型检查,在程序编译时,就需要确定所有变量的数据类型,所以静态类型语言强制要求在使用变量之前事先声明变量的数据类型。因为类型声明机制,静态类型语言的编译器或 IDE 拥有着优秀的代码感知能力,能够更好的辅助程序员开发出复杂且庞大的应用系统程序。典型代表有 C/C++。
int anInt;
char aString[10];
anInt = 1;
aString = {"a","b","c","d","\0”};
动态类型语言则相反,属于非严格数据类型检查。程序在实际运行时,变量的数据类型才被确定。动态类型语言不需要类型声明,同一个变量可以在不同的位置被赋予各种数据类型。只有当程序执行到某条具体的赋值语句时,变量类型才会由赋值对象的数据类型决定。典型代表就是 Python。
因此,Python 程序的开发具有很强的灵活性,同时开发效率也更高。不过,虽然 Python 程序员可以不关注变量的数据类型,但解释器却需要去推断变量的数据类型,这也在一定程序上影响了运行效率。而且数据类型检查不严格,会更加容易埋下不易察觉的 Bug。所以,总的来说 Python 更适合于快速开发中小型应用系统。
>>> obj = 123
>>> obj = 'abc'
强类型 or 弱类型?
强、弱类型指的是编译程序时能否容忍隐式的数据类型转换。
弱类型语言能够容忍在程序运行时对变量进行隐式的数据类型转换,是一种几乎可以忽略数据类型的编程语言。可见,弱类型语言是一种类型非安全的编程语言。
例如 JavaScript:
> '1' + 2
'12'
强类型语言则相反,它是类型安全的。变量的数据类型一旦被确定,除非使用强制类型转换,否则其数据类型永远不会被改变。
例如 Python:
>>> '1' + 2
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: cannot concatenate 'str' and 'int’ objects
那类型安全具有什么意义呢?
描述类型安全系统的最简单的方法就是描述它的对立面。有的语言(尤其是 C/C++)允许做一些非常 “不正当” 的事情。在合适的时候,其功能可能会很强大。但是,世界上没有免费的午餐。所谓 “合适的时候” 实际很少能够遇到。如使用不当,反而极有可能 “搬起石头砸自己的脚”。滥用类型系统就属于这种情况。
打个比方,当程序将一个变量当作类型 A 来执行时,却意外的发现这个变量可能是类型 B,也可能什么都不是。但此时的程序可能已经通过了编译,正在运行的阶段。在这样的情形下,就很可能会导致程序崩溃或异常退出的问题。当然了,这里描述的是编程语言的类型安全系统。但很多时候即便编程语言是类型安全的,也可能被实现出类型非安全的应用程序。所以即便 Python 是类型安全的,但开发者仍需时刻谨慎的处理数据类型问题。
总的来说,强类型语言在速度上会稍逊于弱类型语言,但强类型带来的严谨性能够更好的避免许多错误。
最后
当然,我们可以简单的用「Python 是一门动态的强类型解释语言」来回答此次的问题。但我们通过对比编程语言的 编译/解释、动态/静态、强/弱类型 等特性之后应该可以得到更加深刻的理解。
- Python 具有非常好的跨平台特性,同一套代码能够在不同的平台上正常的运行;
- Python 虽然在编译上作出了努力,但执行速度比较其他编程语言依旧更慢;
- Python 编程很灵活、效率很高,为此也牺牲了代码的严谨性,不适合多人协同开发大规模应用程序;
- Python 虽然是类型安全的编程语言,但因其太多灵活,所以很容易实现出类型非安全的应用程序;
当我们在使用一个工具时,我们首先要做的就是尝试去了解它!