【计算机科学速成课】[40集全/文字版] - 11.编程语言发展史

(。・∀・)ノ゙嗨,欢迎阅读计算机科学速成课!

之前我们把重点放在硬件组成计算机的物理组件,比如电,电路,寄存器,RAM,ALU,CPU
,但在硬件层面编程非常麻烦。所以程序员想要一种更通用的方法编程,一种"更软的"媒介,没错,我们要讲软件!

第8集我们一步步讲了一个简单程序,第一条指令在内存地址0:00101110,之前说过,前4位是操作码,简称OPCODE。对于这个假设CPU,0010代表LOAD_A指令,把值从内存复制到寄存器A,后4位是内存地址,1110是十进制的14,所以这8位表达的意思是"读内存地址14,放入寄存器A"。只是用了两种不同语言,可以想成是英语和摩尔斯码的区别,"你好"和"Hi"是一个意思:你好,只是编码方式不同。英语和摩尔斯码的复杂度也不同,英文有26个字母以及各种发音,摩尔斯码只有"点"和"线"。但它们可以传达相同的信息,计算机语言也类似,计算机能处理二进制,二进制是处理器的"母语",事实上,它们*只能*理解二进制,这叫"机器语言"或"机器码"。

在计算机早期阶段,必须用机器码写程序,具体来讲,会先在纸上用英语写一个"高层次版",举例:"从内存取下一个销售额,,然后加到天、周、年的总和,然后算税",等等。这种对程序的高层次描述,叫"伪代码",在纸上写好后,用"操作码表"把伪代码转成二进制机器码。翻译完成后,程序可以喂入计算机并运行,你可能猜到了,很快人们就厌烦了。所以在1940~1950年代,程序员开发出一种新语言,更可读更高层次,每个操作码分配一个简单名字,叫"助记符"。

"助记符"后面紧跟数据,形成完整指令,与其用1和0写代码,程序员可以写"LOAD_A14",我们在第8集用过这个助记符,因为容易理解得多!当然,CPU不知道LOAD_A14是什么,它不能理解文字,只能理解二进制,所以程序员想了一个技巧,写二进制程序来帮忙。它可以读懂文字指令,自动转成二进制指令,这种程序叫,你可能猜到了,汇编器。

汇编器读取用"汇编语言"写的程序,然后转成"机器码","LOAD_A14"是一个汇编指令的例子,随着时间推移,汇编器有越来越多功能,让编程更容易。其中一个功能是自动分析JUMP地址,这里有一个第8集用过的例子:注意JUMPNEGATIVE指令跳到地址5,JUMP指令跳到地址2,问题是,如果在程序开头多加一些代码,所有地址都会变,更新程序会很痛苦!

所以汇编器不用固定跳转地址,而是让你插入可跳转的标签,当程序被传入汇编器,汇编器会自己搞定跳转地址。程序员可以专心编程,不用管底层细节,隐藏不必要细节来做更复杂的工作,我们又提升了一层抽象。然而,即使汇编器有这些厉害功能,比如自动跳转,汇编只是修饰了一下机器码。一般来说,一条汇编指令对应一条机器指令,所以汇编码和底层硬件的连接很紧密。汇编器仍然强迫程序员思考用什么寄存器和内存地址,如果你突然要一个额外的数,可能要改很多代码,让我们进入思考泡泡。

葛丽丝·霍普博士也遇到了这个问题,作为美国海军军官,她是哈佛1号计算机的首批程序员之一,这台机器我们在第2集提过。这台巨大机电野兽在1944年战时建造完成,帮助盟军作战,程序写在打孔纸带上,放进计算机执行。顺便一说,如果程序里有漏洞,真的就直接用胶带来补"漏洞"。Mark1的指令集非常原始,甚至没有JUMP指令,如果代码要跑不止一次,得把带子的两端连起来做成循环,换句话说,给Mark1编程简直是噩梦!

战后,霍普继续在计算机前沿工作,为了释放电脑的潜力,她设计了一个高级编程语言,叫"算术语言版本0",简称"A0"。汇编与机器指令是一一对应的,但一行高级编程语言可能会转成几十条二进制指令。为了做到这种复杂转换Hopper在1952年创造了第一个编译器,编译器专门把高级语言转成低级语言,比如汇编或机器码(CPU可以直接执行机器码),谢了思想泡泡。

尽管"使编程更简单"很诱人,但很多人对霍普的点子持怀疑态度。她曾说"我有能用的编译器,但没人愿意用。他们告诉我计算机只能做算术不能运行程序",但这个点子是好的。不久,很多人尝试创造新编程语言,如今有上百种语言!可惜的是,没有任何A0的代码遗留下来,所以我们用Python举例(一门现代编程语言)假设我们想相加两个数字,保存结果,记住,如果用汇编代码,我们得从内存取值,和寄存器打交道,以及其他底层细节。但同样的程序可以用Python这样写:不用管寄存器或内存位置,编译器会搞定这些细节,不用管底层细节,程序员只需要创建代表内存地址的抽象,叫"变量"。

给变量取名字,现在可以把两个数存在变量里,这里取名A和B实际编程时你可以随便取名。然后相加两个数,把结果存在变量C,底层操作时,编译器可能把变量A存在寄存器A,但我不需要知道这些!眼不见心不烦,这是个重要历史里程碑,但A0和之后的版本没有广泛使用,FORTRAN,名字来自"公式翻译"。这门语言数年后由IBM在1957年发布,主宰了早期计算机编程。

FORTRAN项目总监JohnBackus说过,"我做的大部分工作都是因为懒,我不喜欢写程序,所以我写这门语言,让编程更容易"。你懂的,典型的"懒人",(白眼)创造自己的编程语言,平均来说,FORTRAN写的程序,比等同的手写汇编代码短20倍。然后FORTRAN编译器会把代码转成机器码,人们怀疑性能是否比得上手写代码,但因为能让程序员写程序更快,所以成了一个更经济的选择。运行速度慢一点点,编程速度大大加快,当时IBM在卖计算机,因此最初FORTRAN代码只能跑在IBM计算机上。1950年代大多数编程语言和编译器,只能运行在一种计算机上,如果升级电脑,可能要重写所有代码!

因此工业界,学术界,政府的计算机专家在1959年组建了一个联盟,数据系统语言委员会,GraceHopper担任顾问。开发一种通用编程语言,可以在不同机器上通用,最后诞生了一门高级,易于使用,,"普通面向商业语言",简称COBOL。为了兼容不同底层硬件,每个计算架构需要一个COBOL编译器,最重​​要的是,这些编译器都可以接收相同COBOL代码。不管是什么电脑,这叫"一次编写,到处运行",如今大多数编程语言都是这样,不必接触CPU特有的汇编码和机器码,减小了使用门槛。

在高级编程语言出现之前,编程只是计算机专家和爱好者才会做的事,而且通常是主职。但现在,科学家,工程师,医生,经济学家,教师,等等,都可以把计算机用于工作。感谢这些语言,计算机科学从深奥学科变成了大众化工具。同时,编程的抽象也让计算机专家,现在叫"专业程序员",制作更复杂的程序,如果用汇编写可能要上百万行。

当然,计算机的历史没有在1959年结束,编程语言设计的黄金时代才刚刚开始,和硬件一起飞速发展。在1960年代,有ALGOLLISP和BASIC等语言,70年代有:Pascal,C和Smalltalk,80年代有:C++,ObjectiveC和Perl,90年代有:Python,Ruby和Java,新千年SwiftC#Go在崛起。不要把Go和《冰雪奇缘》的LetitGo和游戏PokemonGo弄混,有些语言你可能听起来耳熟很多现在还存在,你现在用的浏览器很可能是C++或ObjectiveC写的。

我刚才说的编程语言名字只是冰山一角,新的编程语言在不断诞生,新语言想用更聪明的抽象,让某些方面更容易或更强大,或利用新技术和新平台带来的优势。让更多人能快速做出美妙的事情,许多人认为编程的"圣杯"是直接用英文,直接对计算机说话,然后它会理解并执行。这种智能系统目前只存在于科幻小说,"2001:太空漫游"的粉丝可能没什么意见。现在你理解了编程语言,接下来几集我们会深入了解,编程语言和用语言写的软件,是怎么做到那些酷事。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值