清北物理学毕业后从事算法研发16年,他竟不惜用3年时间也要翻译这本概率论神作!...

34b4f8dcb0bcc2f1f08ee0ea1cb961a4.png

《概率论沉思录》译者廖海仁在读完物理本科和研究生之后,转行从事的是数据挖掘和机器学习算法的研发工作。到现在16年过去,这个行业已经变得非常火热,并有了一个更为时尚且几乎家喻户晓的名字:人工智能。这个行业最直接的基础课程是机器学习,而机器学习的数学基础则包括微积分、线性代数以及最重要的概率统计。

从2019年6月份开始,他主要是翻译了一本叫《概率论沉思录》的原文有750多页的数学著作。历时大约三年。随后,出版社的编辑们又进行了长达两年的编辑校对工作,才正式出版。

本文回顾了作为一名数学爱好者学习数学的心路历程以及个人对于数学学习的一些思考。而最后是微积分、线性代数和概率论相关书籍推荐。

作者:廖海仁


大学与研究生阶段

我大学第一志愿报的是应用物理,第二志愿是应用数学。因为我觉得自己最喜欢的还是物理,其次是数学。大学数学学习按部就班,我们作为物理系学生其实也没有学习数学分析,也是高等数学。教我们高等数学的老师是编写清华《高等数学》教材的施学瑜教授。这大概也是物理系所能得到的数学上的优待了吧。

当时我们已经知道有北京大学张筑生教授编的三册版《数学分析新讲》,有的同学应该拿这套书做参考。不过,对我最有影响的还不是这个,而是R.柯朗的《数学是什么》和《微积分和数学分析教程》(这两本书的第二作者分别是H.罗宾和F.约翰)。当然看这两本书都是在正常的数学学习之外,也是在大三之后。

我先在图书馆里发现了《数学是什么》这本书,就兴致勃勃地将其看完,也感觉到很受益。我对于极限概念的真正理解就是通过阅读这本书得到的。

记得大二时我还跟从自动化系毅然转到物理系的檀时钠同学讨论极限的概念。他说了一大通,我知道他是已经懂了,但是我当时还不懂。若谈天赋,我觉得他在数学和物理上应该属于真有天赋者。据说我们班有好些同学自从他过来后决定不再学习物理,因为肯定学不过他。他后来获得了美国物理斯隆奖,现在是北京大学物理学院的教授。

但我这种数学后知后觉者也通过持续的思考和阅读《数学是什么》获取到对数学“极限”概念一直追求的“理解”:核心是无穷大并不是一个实在确定的数,极限是一个满足极限定义的过程。

然后我又找到了同一作者写的《微积分与数学分析导论》。这是共有两卷,每卷各有二分册的数学教程。我从第一卷第一分册开始看起,开始还是觉得有点难,但是其深刻性吸引着我。我也会一道道去做教程后面的习题,觉得很受益。

这后面的习题没有一道是只套用公式就可以简单解决的,每做完一道都会觉得有收获。这套书比较吸引我的地方还在于作者强调“阐明数学分析与其各种应用之间的相互作用,并强调感性认识的意义”的基本态度。作者在《序言》中说:

“数学,作为一种自封的,一环接一环的真理系统,而不涉及其起因和目的,也是有其诱惑力的,并且还能满足某种哲学上的需要。但是,这种在学科本身中做内省的态度和方法,对于那些获得独立的智能而不是训条式的教导的学生们是不适宜的; 不顾及应用和直观,将导致数学的孤立和衰退,因此,使学生和教师们不受这种自我欣赏的纯碎主义的影响,看来是非常重要的.”

我对于这种态度感到非常认同。遗憾的是,我到临毕业时也只是差不多看完了第一卷第一分册。临毕业时我发觉图书馆里有这套书习题解答的书,还将其中一些以及第一卷第二分册的教材都复印了,希望工作以后能继续看。

除了这两本书外,我还看了一些数学科普及数学史的书,比如克莱因的《数学:确定性的丧失》及《古今数学思想》等,也感觉很受益。《古今数学思想》当时没有完全看完,但是后来学习相应的数学内容时我会补看相关部分。这套书我认为是目前为止我能找到的最好的数学史教材。遗憾的是,其中并不包含对于当代科技影响很大的随机数学(概率论与随机过程)部分。

6e1ac30e678e9d0f295c1cf10a4ad2f0.png

大学毕业后我先工作了三年,是后来考的研究生。前二年在一家电子公司做,其实也没有再学数学,主要是学习工作相关的单片机编程等。到第三年准备考研,我才真正接续了数学的学习。考研虽然是应试的,但是我的目标也很明确,要借这个契机按着数学分析的要求来重新学习一次高等数学。我主要使用的教材是华东师大的《数学分析》以及上面提到的《微积分和数学分析教程》,考研时,满分100的数学我考了96,这个成绩也算是为自己考取研究生立了汗马功劳。

研究生时,我对于数学的兴致越来越浓。“隔壁学校”很多数学老师讲课非常有意思,几乎从所有的数学老师那里都能感受到他们对数学的浓厚兴趣。

我旁听了《微分几何》《实变函数》《拓扑学》等课程,基本是跟着数学系同学一起上课,以至于有个数学系的学生以为我是他们专业的。当他得知我是空间物理专业的学生后吃了一惊。其实我学《微分几何》是为了学习和理解《广义相对论》的需要,其他更多是出于对数学本身的兴趣。

不过还记得我在微分几何课上当我听到老师说刚体运动是一个数学上的平移旋转变换群时的震撼。作为物理系的毕业生我自认为理解什么是刚体运动,直到此时我才觉得原来对于刚体运动的理解还是很浅显,只有换到这个视角才是真正理解了刚体运动。拓扑学课上老师讲如何用两个球体粘合成一个四维空间的讲解也很有意思,非常符合我认为自己花了很长时间才想通的宇宙形状的直觉。

当时我对概率论也有一定兴趣。原因是我们研究生同学一起坐火车去上海开行业会议,有多个人玩杀人游戏,有位女同学连续两次抓到的牌是杀手,成功地当了两次职业杀手。第三次大家重新玩,几个人无辜被杀。大家又怀疑起她。她为自己辩护道,上两次次我是杀手,这次我又是杀手的概率是很小的。而别人则说,每一次都是重新开始的,你当凶手与我们可能是凶手的概率是相同的。

我好奇从概率论的角度,我这位女同学对自己的辩护是否有道理。我自己找了本概率教材来自学,也做了些笔记,但是并没有完全学完。反而是对于线性代数,研一那个暑假,我找来北京大学的《高等代数》教材,并将其完整学习了一遍。

另外听过的一些数学演讲让我记忆犹新:一次是听文兰院士的演讲。他说他想将数学从微积分开始重新学习一遍。他当时已经是院士了,应该也已经有了很大的数学成果,但是为什么还希望从微积分开始重新学习数学呢?这种学习肯定属于为己之学。这也几乎成了我自己的数学愿望:我并不以数学为业,但是基于兴趣,我也希望自己能将重要的数学课程逐渐学习一一遍。

另一次是听陈省身先生的演讲,当时陈先生已经92岁了,是坐着轮椅出来的,但是目光深睿。他讲的如何从几何角度看待DNA双螺旋结构让人很震撼。(这篇网络文章大致记录了类似的陈先生演讲的内容:https://www.163.com/dy/article/EPA2RUO20538057A.html) 

还有一件事让我印象深刻。有一次去人大英语角,碰到一位读力学的清华师弟,我们两个人辩论了半天,原因他说物理比数学重要,我说数学比物理重要。我很能理解他对物理的热情以及物理重要的认知。但是若论总体重要性而言,我还是认为数学更为重要一些,因为它是所有定量科学的基础。我读高中的时代,理科数理化分数是相同的。现在数学被赋予更高的分数,物理则总体分值更低些。我的一些继续研究物理的同学还对此感到痛心疾首,他们认为这对于后续的科学研究不利。然而,我则认为将数学赋予更高权重是合理的,尽管物理学作为现代科学的典范学科,其重要性不言而喻。

读完空间物理研究生才想着转行做互联网的原因一言难尽。当时阅读的文献中已经出现了星际互联网(Inter Planetary Network,IPN)的概念,就是不同国家的深空探测器都可以通过IPN传输数据。对IPN的接触让我意识到互联网的出现是这个时代一件大事,自己或许应该对这个新生事物有更多了解。另一方面,可能也是不希望自己的工作过于偏理论。

研究生时选了俞允强教授的《广义相对论》和《物理宇宙学》课程。但是上课时发觉旁边一起上课的可能有一半是校外的业余相对论研究者或物理学爱好者。我不想用”民科”一词来形容这样一个群体,因为这似乎代表了一种所谓科班出身者的傲慢与偏见。我经常为这个群体中的人对于物理和数学的热情而感慨(数学方面就是有一批相信自己已经证明哥德巴赫猜想的人,但是却是用初等数学的方法)。

他们大多相信自己已经证明相对论或量子力学错了,并且已经创建了一套更好的理论。据说劝退这群人继续研究物理的最好方法是告诉他们离开了数学语言,现代物理学难以为继。但是事情往往也没有那么简单。我曾经去过一个物理学“独立研究者”家里并跟他聊了一晚上。他法律博士毕业,现在已经辞职专门研究物理(前提是他北京家里的确有十套以上的房子作为经济支撑)。

他研究的物理理论中也的确有一些简单的数学公式。不过我的确怀疑这些公式的来源与推导过程是否可靠。因为他曾经问我1/(1+x)的数列展开为什么是1-x +x^2-x^3-x^4+x^5+…… 而不是1-x^2-x^3-x^4...另外,又说“如果物质只会进入黑洞,又不会出来的话,这岂不是说黑洞里的质量不会守恒了?”

工作之后

再之后是南极中山站的一年。我当时已经确定转行计算机,所以在中山站主要是以学习计算机相关内容为主,数学上主要是学习离散数学,另外还带了一本F. 哈拉里的《图论》,也看了一部分。那时中山站也没有互联网,基本是与世隔绝的状态。这是一本我2000年从旧书摊淘到的书,这本《图论》从哥尼斯堡七桥问题讲起,我只觉得讲得很好。但是也不清楚作者的背景,回来后查了查互联网,才知道作者是著名的图论学者。计算机方面高德纳(Knuth)的《计算机程序设计艺术》给了我很大的震撼,但在那里也只是学习了其中第一卷的部分内容。

工作时我主要从事数据挖掘和机器学习算法工作。所以我后面的学习主要跟机器学习相关。做机器学习和数据挖掘离不开数据分析,所以统计学可以说是最直接的基础。所以数学方面我补充的主要是概率论和统计学的书,概率论主要是将汪仁官教授的《概率论引论》以及复旦大学李贤平教授的《概率论基础》看完并做完了习题。

概率统计方面陈希孺院士的书对我的影响比较大,我几乎买了他的所有著作: 《概率论与数理统计》《数理统计学教程》《非参数统计》《高等数理统计学》等。不要以为大佬的炼成是一日之功。我淘到过一本陈希孺先生1980年由重庆师范学院数学印的《概率论及其应用题解》,其中凭一己之力解答了费勒两卷本经典概率论教材的所有习题,这也可见他在概率论方面用功之深。陈希孺先生的书籍也是国内不多的在其中比较详细介绍贝叶斯统计的教材。

他的《数理统计学简史》也很有助于培养“统计思想”的统计学史著作。陈先生在本书《序》中说:“统计学不止是一种方法或技术,还含有世界观的成分——它是看待世界上万事万物的一种方法,我们常讲某事从统计观点看如何如何,指的就是这个意思,但统计思想也有一个发展过程。因此,统计思想(或观点)的养成,不单需要学习一些具体的知识,还要能够从发展的眼光,把这些知识连缀成一个有机的、清晰地图景,获得一种历史的厚重感。”学习概率与统计的历史有助于我们更深入地理解概率的基本概念,并培养统计思想。

c92ae654289813d2d2f4517461dd7c96.png

F.哈拉里的《图论》及陈希孺先生的《概率论及其应用题解》

关于做题,陈先生在《高等数理统计学》(其中有一半是习题解答)一书的序中写道:

“...多做习题,尤其是多做难题,对掌握并熟练数理统计学基本的论证方法和技巧,有着不可替代的重要性。如果通过一门基础课的学习,只是记住了若干概念,背了几个定理,而未能在这方面有所长进,那真是‘入宝山而空返’了,技巧的熟练固非一日之功,但取法乎上,仅得乎中,必须在开始学习基础课时就设定一个高目标,日后进入研究工作,克服难点的能力如何,相当一部分就取决于在这方面修为的深浅了。同时,经验表明,在打基础的阶段因忽视习题而导致素质上的缺陷,在日后不易弥补,或事倍功半。

笔者在学生时代及其后的几年中,对做习题未给予足够重视。当时误认为做题费时间,不增长新知识,不如多读些书,站得实地。以后试做研究工作,就日渐感到其不良后果,表现到碰到问题办法少,容易钻死胡同,克服难点的能力弱,以致对自己缺乏信心。对许多方法,都似雾里看花,似曾识面,而不能切实掌握和灵活运用。有如十八般兵器,样样都见过,但拿到手里,就使不动或很笨拙。欲以此克敌制胜,自难有成......

从‘打基础’,锻炼技巧和提高能力诸目标看,非做难题不行,这道理正如训练运动员要加大运动量,做高难动作,不然,在训练的过程中舒服了,就别指望出好成绩。何况,对一个有志于在将来搞基础研究的人,日后在研究工作中将碰到的难点,比起这些习题,又要高出若干个数量级。如果现在面对这些习题尚且有畏难情绪,那又怎能指望在日后研究工作中能具备克服更大困难的能力和信心?

...对读者而言,笔者切望这部分(习题解答)是备而不用、备而少用。如碰到一个题一时做不出来,宁肯暂时搁一搁,也不要轻易翻看解答。譬如登山,经过艰苦努力上了峰顶,只有其乐趣和成就感。反之,如在未尽全力之前就任人抬上去,则不惟无益,实足以挫折信心。“

陈先生在此处提到数理统计学的学习方法对于学习所有数学都是适合的,其中主要提到学习数学时做习题与做难题的重要性。做难题,对于数学研究者尤其重要,因为数学研究很多就是解决别人未解决的超级难题。而对于一般的数学应用者,要求可以稍微降低。物理学家胡宁曾经说做题不用做得太多,我想学习物理与数学在做题方面的要求会有所不同吧。物理学更偏于对于基本概念的理解。

此外对我产生深刻影响的是美国数学物理学家E.T.杰恩斯的遗著《概率论沉思录》。2009年8月,在海淀图书城的九章书店,我看到了人民邮电出版社出的这本书的英文影印版。看了一下前言觉得很吸引我,就买了下来。但是正如大多数我买的新书一样,这本书在我的书架上沉寂了四五年,直到2015年左右我在品友做DSP算法优化相关工作时,我才下定决心将其看完。

记得有将近两年时间,几乎每个周六上午,在焚香静坐之后,我都会拿一上午的时间来看这本书。看的过程中经常感到非常喜悦。北宋程颐谈到读《论语》时说“有读了全然无事者;有读了后其中得一两句喜者,有读了之后好之者,有读了后直不知手之舞之足之蹈之者”,在读这本书时我的确好几次体会到这种近乎手舞足蹈的感觉。

自己对一些问题有了一定的思考,却又百思不得其解,却忽然看到作者在某一章的开始对类似的问题进行描述,宣称要在这一章中对这一问题进行讨论和解决,这该让人何等的兴奋呢!可以说,阅读这本书改变了我对于概率论、统计学、数据挖掘、机器学习、人工智能甚至整个世界的认知。我读这本书是由于兴趣,但也可以说是工作实际应用的需求。

若说学习了这种基础性的数学对我做机器学习有什么实际影响,我想借用杰恩斯本人在书中的话“在能力与通用性方面,学会使用作为扩展逻辑的概率论的科学家比仅掌握了一堆无关的特定工具的人具有更大的优势,随着问题复杂性的增加,这种相对优势也会扩大”。

很多人搞机器学习的人只是掌握一堆工具或算法包,碰到问题就尝试套用工具包去解决,但是在遇到无法直接套用工具包的问题时就会感到不知所措。但是有了良好的概率论基础,我们就可以原初地思考问题(这些问题很多是存在本身的不确定性),并直接尝试应用概率论原理来解决问题。

本来按照我的工作相关,最最核心的基础课程是机器学习。但是概率论和统计学又是机器学习的基础。我本来计划花一二年时间将机器学习的经典三大本PRML/MLaPP/ESL通读一遍并做完所有习题。但是看了杰恩斯的书之后,我还是觉得自己的概率论基础仍然需要加深。所以当我有难得的一年“休整”时间时,我几乎将这一年时间中科技相关的学习时间都投入到了深入学习概率论之中。

这一年中,我阅读了Seldom Ross的《概率论基础教程》,钟开莱的《初等概率论》、格涅坚科的《概率论教程》(中文版是从孔夫子旧书网淘的人民教育出版社1956年的繁体版古旧老书,不过我也从Amazon找到并购买了该书的1998出版英文第6版也是最后一版)、迪米特里·伯特瑟卡斯、约翰·齐齐克利斯著的《概率导论》并几乎做完了其中的所有习题。

另外也看了柯尔莫哥洛夫的概率数学公理化奠基之作《概率论基础》。这是一本不到80页的小薄书,但是抽象性很高,只能慢慢咀嚼,但是看完受益很大。费勒的《概率论及其应用》第一卷相对而言要难些,只看了第一卷的一部分,但是有些章节也是多次阅读,而且每一次阅读都有新的收获。像类似这种经典数学书籍,是不太可能阅读一遍就完全理解。我知道,概率论也会是我将来一生持续的兴趣和钻研方向所在,将来会持续学习更高级的部分。

2019 年,由于知道我有购买英文原版书的习惯,在人民邮电出版社工作的朋友问我有没有人工智能方面值得引进的好书推荐。我主要向他推荐了Judea Pearl的三本关于因果推断的书,另外问了他杰恩斯的这本《概率论沉思录》是否有人翻译。他问了出版社后说还没有,因为这本书实在是太厚了,似乎没有人愿意翻译。于是,我主动请缨来翻译这本书,出版社也给予了支持。

翻译过程虽然辛苦,但也的确充满了愉悦,因为这种经典书籍几乎每读一遍都会有新的收获。ChatGPT时代,翻译本身一般会被认为没有太多价值。然而,我认为我翻译这本中文版《概率论沉思录》的主要价值在译后记部分:我根据自己的多年的理解以及阅读多本其他概率论书籍的思考,撰写了约20页的译后记,旨在为读者提供本书的导读与解析。

数学学习之思

这一部分我想谈谈自己对于数学学习的一些思考。

首先是关于数学天赋。现在经常听到的说法的是“在天赋面前,努力不值一提”,“天赋大于努力”,而且这些说法似乎深得人心,尤其是对于数学是如此。我却认为可以忘记“天赋”一词。

我们不可否认人与人之间天生的数感差异,但是这只是一种天生的优势和潜力,如果没有后天持续的学习和努力,这种所谓的“天赋”将永远不会开花结果。过于强调天赋往往会给自己的不努力提供借口。

其实,关于这个问题,孔老夫子的话很值得我们思考。他曾说,“十室之邑,必有忠信如丘者焉,不如丘之好学也”。他又说“唯上知与下愚不移”。数学天才和数学极不开窍的人当然都是存在的,但是却跟我们普通人无关。而且,能得菲尔茨奖需要的数学天赋跟我们普通人学习与应用数学所需要的数学天赋也不相同。

至少在高考这个级别,谈论天赋都没有太大意义。高考数学压轴题的正确率一般也会是1%以上。我们肯定不会将百里挑一的人就认为是天才。我们普通人还是要相信“人一能之,己百之;人十能之,己千之。果能此道矣,虽愚必明,虽柔必强”的《中庸》基本精神。

另一个可以给我们借鉴的例子是跟“学好数理化,走遍天下都不怕”这句名言有关的钱伟长先生。他高考国文和历史满分、数学15分、物理5分、化学5分。在现在看来钱先生肯定是要归为数学上的“下愚”之列了。可是人家却偏偏要走科学救国之路,转学物理学。他自诩全校最勤奋之人,每天5点去图书馆背书,没想到这时候华罗庚先生已经背完了。结果我们也看到了,老先生最终成为了一名卓有成就的物理学家。

可见,数学考15分也未必说明没有数学天赋。老是认为自己天赋或智商不如人很可能是画地为牢。

相比于天赋,我认为更为重要的,是持久的兴趣与学习。培养兴趣最有效的当然是来自良师的引导和感染。但是现代信息社会,即使没有碰到良师,也可以通过阅读自己培养兴趣的。

现在有很多好的数学科普与数学家传记书籍都有助于培养数学兴趣。比如哈代的《一位数学家的自白》,保罗·哈尔莫斯的《我要做数学家》等等。有了兴趣,更重要的还是踏踏实实花时间努力学习。“为人不易,为学实难”,民国时期新儒家熊十力先生经常对学生做这样的感慨。我们很多人都可能认为现代社会学习比原来容易了,其实未必。

现代社会的学习往往添加了很多功利的因素,高考之前的学习为了更高的高考分数,大学学习为了更高的绩点,工作之后学习为了更高的工资。互联网社会我们获取最优秀书籍的成本低了许多,但是诸多信息的干扰和生活的压力让沉下心来读书更为不易。要有持续学习的动力,有着良好的学习动机很重要。学习动机以学问本身的兴致为上,以学以致用为中,以将学习作为功利性工具为下。有了兴趣和正确的学习动机,每天花一定时间定时学习进步,则可以体会“学而时习之不亦说乎”的境界。

关于数学之重要性。数学在现代社会的重要性不言而喻,因为数学是所有自然科学、社会科学甚至工程技术的基础与工具。数学的重要性还体现在它对于人类思维的锻炼上。数学的学习过程,实际上是一个不断锻炼逻辑思维、提高抽象能力的过程。

人工智能时代,我们面临的一大问题是学校教育应该教什么,学生应该学什么?因为学生在学生时代学习的技能,在他开始找工作时已经被人工智能代替了。我对这一问题的看法是:如果不知道学习什么的话,那么就多花时间学基础课程:数学和人文。我大学时学习的Fortran语言,十年前学习的Perl、Pig语言,现在很少使用了,但是那时候学习的微积分和线性代数却仍然在使用。“唯数学不会辜负人”,我们需要有这种信念。

我体会到的数学学习有两大特点。一是数学学习没有捷径,也不可能速成。比如我在知乎里就看到这样的帖子“如何在1-3天内自学概率论”。这也代表了国内典型的浮躁之气。我的回答是:“1-3天自学概率论只能将书当小说一样翻一遍,知道些名词术语,但是真要懂什么,简直就是痴人说梦”。

数学的进步是缓慢的,无论是数学分析、线性代数还是概率论,发展到现在的程度,花费了多少人数百年的努力来构建起来,凭什么你只需要一年半载就可以完全掌握呢?数学书也没法像读小说一样一个小时一二十页。经典的书,很多时候一个小时能看完并很好理解一页就已经很不错了。

半年学通Python是没问题的,但是一个人要是说他半年就可以从零基础完全掌握数学分析或者概率论,我却不相信。正因为数学没法速成,所以一个人经过长期积累的数学基础才可以成为其硬资产。

二是学习数学需要循序渐进。这可能是数学跟人文学科的主要区别之一。传统文化读四书五经,虽然也有建议的阅读顺序,但是没有人说一定只能先读《论语》才能读《孟子》。但是数学却不太相同:很多课程都有先修课程,如何先修课程没有掌握,其实很难掌握这门课程。

比如概率论在随机变量函数的分布需要用到多重微积分的内容,讨论多元正态分布是需要用到矩阵符号,所以微积分和线性代数是概率论的先修课程。这些都是需要循序渐进学习的。坊间有言“实变函数学十遍,随机过程随机过”。如果有人真的感觉学习实变函数、随机过程特别难,很可能是这些课程的先修课程微积分、高等代数和概率论没有学好。

为什么学过后会没有学好呢?我的总结是学习深度不够。我有一个观点,就是所以对于基于数学的科学技术相关任一专业有所追求者,都值得将大学层次的数学基础课(微积分、线性代数、概率论等)自己研读再学习一遍(除了那些本身就在顶级大学数学系,整日沉浸在数学之中,且已经学得很深很好的人外),并且最好学习到数学系的难度。

有人可能会说,我大学相应课程考试都考了90分以上,还需要再学习一遍吗?我的回答是需要。一是大学课程学习基本是以考试为目的,时间也比较仓促,考试级别的考分高低跟自己是否真正理解其实是不太相关的。

二来大学所用的教材一般是学校老师自编的教材,跟国际上的数学名著和最好的教材一般还是很差距的。能轻易得到世界一流的经典名著,包括其中文版,这是我们这个时代的学习者最重要的优势之一。尽量研读世界级的名著,而不要在二流教材上浪费太多精力,这与是否尊师重教或是否爱国无关。

需要学到数学系的难度一是由于这几门课最为基础,对于后续专业的发展很重要。若学得太浅,相当于盖楼地基打得不深,将来只能盖小洋楼,而不能盖高楼大厦。二是由于这几门课程其实也没有那么抽象,一般人是可以按照数学系的要求学习掌握的。

但即使是世界名著,每门基础课程甚至都可能找到很多本。那么该如何选择,选多少本呢?我的观点是可以先选择两本内容组织方式差别较大,能形成一定相互补充作用的两本。一本作为主要教材,另一本作为主要参考。这样的好处一是多维度理解:不同作者对于同一数学概念或原理的阐述可能会有所不同。这种差异能够帮助我们从多个角度、多个维度去理解数学知识,从而加深理解。

二是补充成全:两本书的内容组织方式差别较大,意味着它们可能在某些方面各有侧重。一本可能更注重理论推导,而另一本可能更注重实际应用或习题解答。这样的组合能够为学生提供更全面的学习体验,确保学习的深度和广度。一门课程有了两本经典教材作为基础,再看其他就会比较快了,因为只看前面两本没有涉及的部分就够了。如果是比研读教材更低级别的教材,的确也是可以向看小说一样快速看完的。

最后是关于做题,前面陈希孺先生的引用已经说的很清楚了。不做题谈不上学习数学的。自学数学的话尽量要选择有习题答案的教材。尽管习题当然要先做再对答案,但若完全没有答案,可能很难验证自己的学习成果。

学习贵在有恒,如果能每天抽出1小时学习数学,并且每天至少做1道习题。长久坚持下来,必有收获。心中常有几道数学题可思考,也是一件很幸福的事情:无论坐地铁还是坐车都可以用来思考,而不用一有空就抱着手机看了。

微积分、线性代数与概率论教材推荐

终于到了真正书籍推荐的部分。不过在正式推荐之前,我还是想引用L.戈丁《数学概观》中关于数学教学的一则寓言:

三种办法:

老师对他班上的同学说,我要给你们讲解正比例的概念。这个概念在数学、物理学、社会科学和日常生活中,都有用处。它考虑两个变量x和y,其中y依赖于x,其定义(他转过身去面向黑板,开始写):

y称为与x成比例,如果存在一个数a,使得对于x的

每个值以及y的对应值,都有y=ax。

于是他转过身来看看全班。只有一二个人懂了。老师再试着讲解。好了,你们看,我刚才写的是什么意思。例如,假如我们令a=2(他又转过身面向黑板,并写下)

           对于所有x, y=2x

他又转过身来,看着全班同学。现在几乎每个人都懂了。但是还有两张发呆的脸。老师再试着讲解。好了,你们看,我刚才写的是什么意思。比如说,我们令x=3, 那么y=6(他在黑板上写)

              6=2x3

他转过身来看着全班同学。这回人人都明白了。

引用这一寓言的目的是为了说明数学教学或者数学教材大致有三种抽象层次:一是极其抽象,只适用于极少数学生(基本可以说是给其他未来的数学家看的),我将其定义为3.0层次;二是有一定抽象,但是有一定直观基础,适合于大多数学生,我将其定义为2.0层次;三是将其完全具体化,基本没有什么抽象,基本所有学生都能懂,我将其定义为1.0层次。

我对于数学学习的建议是在看一本1.0层次的教材后,尽量选择一二本2.0层次的教材进行研读,这样既有一定的抽象性,又不至于感到太难。看完2.0层次的书后其实3.0层次的书籍也是可以理解的,至少不会被人用一些抽象数学符号将你吓唬住。

我在下面推荐书籍时尽量在后面标识一个1.0至3.0之间主观数字级别标识难度,供读者参考。

3.1 微积分与数学分析

小平邦彦.《微积分入门》. 人民邮电出版社(1.8)

小平邦彦是日本数学家,菲尔兹奖和沃尔夫奖得主,本书是作者晚年创作的经典微积分著作,其特点在于突出“严密”与“直观”的结合,并重视数学中的“和谐”与“美感”。

R.柯朗,F.约翰. 《微积分和数学分析引论》. 科学出版社(2.0)

共两卷四分册。如果是物理方向的学生,这套微积分与数学分析教材是我最为推荐的一套,因为诸如第四章“在物理和几何中的应用”这样的章节在其他教科书中是很少出现的。本书特别强调概念的直观与明晰,在涉及到理解的细微之处绝不含糊,却不重无关大体的完备。本书采取研讨式而不是中国教科书演绎式的介绍方式。

G.H. Hardy.《纯数学教程》 人民邮电出版社(2.5)

百年经典,20世纪初数学分析领域的奠基性著作。虽然作者哈代于1947年已经去世,但是这本书到现在也完全不过时,这就是数学的魅力。

陶哲轩. 《陶哲轩实分析》. 人民邮电出版社 (2.5) 

《陶哲轩实分析》是一本强调严格性和基础性的实分析教材,其内容涵盖了从数系的结构和集合论到Lebesgue积分的全面知识。书中的习题与正文内容紧密相关,有助于读者更好地理解和掌握知识。适合于学过基础微积分的人进一步深入学习实分析。

以上是四本教材,以下这本是推荐必看的重要参考书:

辛钦著,齐友民译.《数学分析八讲》.人民邮电出版社(2.0)

  辛钦是前苏联数学家和数学教育家,是现代概率论的奠基人之一。本书通过八个小讲座分别讲解连续统、极限、函数、级数、导数、积分、函数的级数展开和微分方程等八个方面,能加深我们对这些基本概念的理解。

以下这两本是微积分历史科普书,可以帮助理解基本概念:

William Dunham著.李伯友等译.《微积分的历程——从牛顿到勒贝格》.人民邮电出版社 (1.0)

卡尔.B.波耶著,唐生译.《微积分概念发展史》. 复旦大学出版社 (1.0)

3.2 线性代数

David C. Lay. 《线性代数及其应用》(Linear Algebra and Its Applications)(1.0)

David Lay的著作以易懂著称,比较适合初学者. 此书有英文影印版和中文版。每章有习题且有部分习题答案。

Gilbert Strang《线性代数及其应用》(Linear Algebra and Its Applications) (1.0)

这本书由MIT的著名教授Gilbert Strang撰写,以清晰的逻辑和丰富的应用实例著称。其实若是单独作为教材我是不太推荐的,最有价值的是网上能找到Gilbert Strang的讲课视频,这是非常难得的学习材料,可以结合教材使用。

Sheldom Asler《线性代数应该这样学(第3版)》.人民邮电出版社.(2.0)

公认的阐述线性代数的经典佳作,被全球40多个国家、300余所高校采纳为教材。抛弃晦涩难懂的行列式,从向量空间和线性映射出发描述线性算子。包含习题和大量示例,提高学生理解和熟练运用线性代数知识的能力。

斋藤正彦.《线性代数入门》.人民邮电出版社(2.0)

  日本长销的线性代数入门名著,书后有习题答案,适合自学。本书去年才由图灵翻译出版,值得关注。

Peter D. Lax. 《线性代数及其应用》. 人民邮电出版社. (2.8)

   这本书跟D.C. Lay的书是同样书名,但是难度其实不是一个级别,适合作为高等线性代数教材使用。作者是Peter D. Lax教授是阿贝尔奖和沃尔夫奖得主。每章都有习题,并提供解答。

3.3 概率论

钟开莱 《初等概率论(第4版)》(Elementary Probability Theory).世界图书出版社 (1.0)

钟开莱(1917~2009)是著名华裔数学家、概率学家,被誉为美国”概率教父”。

《初等概率论》是一部介绍概率论及其应用的入门教程。第4版特别增加了两章讲述应用和数学金融,传承前面版本详细、严谨的风格,讲述了有价证券和期货理论的基本知识。但是作为非金融数学方向的读者可以略去。本书第8章(From Random Walk to Markov Chains)是笔者读到的讲马尔科夫链最清晰明了的教材。每章有习题且配有答案。遗憾的是本书原来好像有中文版,现在却不容易找到。值得说明的是,作者还有一本基于测度论的《概率论教程》,难度为2.0,不适合作为概率论入门教材。

Sheldom Ross(罗斯) 《概率论基础教程》(A First Course in Probability) (1.5)

本书是全球高校采用率最高的概率论教材之一,初版于1976年,多年来不断重印修订,最新好像已经到第九版。本书叙述清晰,例子丰富,有助于学生建立概率直觉。每章都有习题和理论练习,可能显得有些多,有些也会有点简单重复,但是若能坚持做完也会很有收益。书后有部分习题答案,网上能找到全部习题解答,适于自学。

Dimitri P. Bertsekas等著. 《概率导论(第2版修订版)》 人民邮电出版社(1.5)

本书基于麻省理工学院开设的概率论入门课程编写,内容全面,例题和习题丰富。习题有答案,适于自学。本书的特点是从一开始就同时介绍概率的贝叶斯和频率这种视角,并且有两章分别介绍频率派统计与贝叶斯统计。一章介绍马尔科夫链,一章介绍伯努利过程和泊松过程(相对一般概率论书籍独特的一章)。国内读者可能感到稍微不适的地方是本书并没有单独一章介绍期望与方差,而是融合在随机变量章节中进行介绍。

以上教材建议3选2, 建议将钟开莱教授的那本作为必选,然后另选一本。

William Feller(威廉·费勒)《概率论及其应用》.人民邮电出版社(2.5)

  本书分1/2两卷,第1卷为普通概率论内容,第2卷为高级部分。本书本书是十分经典的概率论教材,曾经影响了包括中国在内的世界各国几代概率论及其相关领域的学生和研究者。配有丰富的例子和大量的习题,涉及多个领域的应用,极具启发性。陈希孺先生编有所有习题的详细习题解答。本书是数学概率论的集大成之作。

E.T. Jaynes (杰恩斯)《概率论沉思录》. 人民邮电出版社 (2.5)

对于是否推荐这本书,我其实曾有一定犹豫,主要是自己翻译了这本书。后来觉得本着举贤不避亲的精神,还是应该将其列出来。资深计算机技术和概率统计专家凯文·范霍恩(K. S. Van Horn)认为本书是 20 世纪最重要的概率论著作之一。恐怕将本书看做费勒《概率论及其应用》之后的最重要概率论著作也不为过。本书以与费勒的书不同,采用科学和逻辑的视角,将概率论视为布尔逻辑的扩展与科学的逻辑。本书也是客观贝叶斯主义概率论的代表著作。

Kolmogorov.《概率论基础》(Foundations of Probability Theory) (3.0)

这本书的中文版叫《概率论基本概念》,已经很难找到。反而是英文版Foundations of Probability Theory比较容易找到。本书就是作者将概率论变成一门数学的奠基之作。这本书很薄,读者可以通过这本书体会什么是3.0级别的数学书籍。


作者简介:

廖海仁,本科毕业于清华大学物理系,北京大学空间物理学硕士。中国第22次南极科学考察队员,曾在南极中山站越冬14个月,是中澳日合作高空大气物理观测项目执行人。 拥有16年以上数据挖掘与机器学习算法一线研发实际经验。长期 BI、推荐系统、计算广告系统开发与优化经验,尤其精通程序化广告优化相关算法。2013年全球RTB广告DSP算法大赛主要组织者之一,后整理公布全球范围内第一个RTB广告数据集。曾主导了四家以上互联网公司算法从0到1的过程。曾任风行网数据挖掘部负责人、品友互动算法架构师、Keep人工智能中心算法架构师等。图灵数学经典《概率论沉思录》中文译者。 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值