【数学之美系列十四 】谈谈数学模型的重要性

转载 2007年10月05日 04:16:00
 2006年8月9日 上午 09:12:00
发表者:吴军,Google 研究员

[注:一直关注数学之美系列的读者可能已经发现,我们对任何问题总是在找相应的准确的数学模型。为了说明模型的重要性,今年七月份我在 Google 中国内部讲课时用了整整一堂课来讲这个问题,下面的内容是我讲座的摘要。]

在包括哥白尼、伽利略和牛顿在内的所有天文学家中,我最佩服的是地心说的提出者托勒密。虽然天文学起源于古埃及,并且在古巴比伦时,人们就观测到了五大行 星(金、木、水、火、土)运行的轨迹,以及行星在近日点运动比远日点快。(下图是在地球上看到的金星的轨迹,看过达芬奇密码的读者知道金星大约每四年在天 上画一个五角星。)

但是真正创立了天文学,并且计算出诸多天体运行轨迹的是两千年前古罗马时代的托勒密。虽然今天我们可能会嘲笑托勒密犯的简单的错误,但是真正了解托勒密贡 献的人都会对他肃然起敬。托勒密发明了球坐标,定义了包括赤道和零度经线在内的经纬线,他提出了黄道,还发明了弧度制。

当然,他最大也是最有争议的发明是地心说。虽然我们知道地球是围绕太阳运动的,但是在当时,从人们的观测出发,很容易得到地球是宇宙中心的结论。从地球上 看,行星的运动轨迹是不规则的,托勒密的伟大之处是用四十个小圆套大圆的方法,精确地计算出了所有行星运动的轨迹。(托勒密继承了毕达格拉斯的一些思想, 他也认为圆是最完美的几何图形。)托勒密模型的精度之高,让以后所有的科学家惊叹不已。即使今天,我们在计算机的帮助下,也很难解出四十个套在一起的圆的 方程。每每想到这里,我都由衷地佩服托勒密。一千五百年来,人们根据他的计算决定农时。但是,经过了一千五百年,托勒密对太阳运动的累积误差,还是差出了 一星期。

地心说的示意图,我国天文学家张衡的浑天地动说其实就是地心说。

纠正地心说错误不是靠在托勒密四十个圆的模型上再多套上几个圆,而是进一步探索真理。哥白尼发现,如果以太阳为中心来描述星体的运行,只需要 8-10  个圆,就能计算出一个行星的运动轨迹,他提出了日心说。很遗憾的事,哥白尼正确的假设并没有得到比托勒密更好的结果,哥白尼的模型的误差比托勒密地要大不 少。这是教会和当时人们认为哥白尼的学说是邪说的一个原因,所以日心说要想让人心服口服地接受,就得更准确地描述行星运动。

完成这一使命的是开普勒。开普勒在所有一流的天文学家中,资质较差,一生中犯了无数低级的错误。但是他有两条别人没有的东西,从他的老师第谷手中继承的大 量的、在当时最精确的观测数据,以及运气。开普勒很幸运地发现了行星围绕太阳运转的轨道实际是椭圆形的,这样不需要用多个小圆套大圆,而只要用一个椭圆就 能将星体运动规律描述清楚了。只是开普勒的知识和水平不足以解释为什么行星的轨道是椭圆形的。最后是伟大的科学家牛顿用万有引力解释了这个问题。

故事到这里似乎可以结束了。但是,许多年后,又有了个小的波澜。天文学家们发现,天王星的实际轨迹和用椭圆模型算出来的不太符合。当然,偷懒的办法是接着 用小圆套大圆的方法修正,但是一些严肃的科学家在努力寻找真正的原因。英国的亚当斯和法国的维内尔(Verrier)独立地发现了吸引天王星偏离轨道的海 王星。

讲座结束前,我和 Google 中国的工程师们一同总结了这么几个结论:
1. 一个正确的数学模型应当在形式上是简单的。(托勒密的模型显然太复杂。)
2. 一个正确的模型在它开始的时候可能还不如一个精雕细琢过的错误的模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去。(日心说开始并没有地心说准确。)
3. 大量准确的数据对研发很重要。
4. 正确的模型也可能受噪音干扰,而显得不准确;这时我们不应该用一种凑合的修正方法来弥补它,而是要找到噪音的根源,这也许能通往重大发现。

在网络搜索的研发中,我们在前面提到的单文本词频/逆文本频率指数(TF/IDF) 和网页排名(page rank)都相当于是网络搜索中的“椭圆模型”,它们都很简单易懂。

http://googlechinablog.com/2006/08/blog-post_09.html  

相关文章推荐

数学之美 十四 谈谈数学模型的重要性

本文系转载。 2006年8月9日 上午 09:12:00 发表者:吴军,Google 研究员  [注:一直关注数学之美系列的读者可能已经发现,我们对任何问题总是在找相应的准确的数学模...

谈谈数学模型中的自由度

这里,我们简单谈谈建立一个数学模型时,一个最关键的问题。即什么样的模型是好的,或者说怎么评价模型的准确性。

【数学模型】椅子能在不平的地面上放平吗?(1)

近期对数学爆发出了浓厚的兴趣,再加上准备参加2016年的数学建模美赛,于是开始接触数学建模,想通过这一系列的博客记录自己学习的历程,于是将本系列博客命名为【数学模型】,同我所看的数学建模书名。第一篇文...

《计算机算法与数学模型<上>》期末考试试题

微信扫一扫  解答问题   北京邮电大学2016—2017学年第一学期 《计算机算法与数学模型上>》期末考试试题 说明:1)本次考试采用开卷方式,答卷时间为一周(2016年12月29日-201...

基于lucene的案例开发:索引数学模型

lucene将一篇文档分成若干个域,每个域又分成若干个词元,通过词元在文档中的重要程度,将文档转化为N维的空间向量,通过计算两个向量之间的夹角余弦值来计算两个文档的相似程度

Hacker's Crackdown(UVa 11825)状态压缩dp+数学模型

来自《算法竞赛入门经典训练指南》 1.题目原文 https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page...

海啸的数学模型(也是微分方程组)【作者:泰瑞陶】

原始文章 The shallow water wave equation and tsunami propagation 13 March, 2011 in expository, math.A...

各向异性滤波算法+数学模型分析

matlab练习程序(各向异性扩散)http://www.cnblogs.com/tiandsp/archive/2013/04/18/3029468.html 主要是用来平滑图像的,克服了高斯模...

诚实国度的借道问题用数学模型解

本文发表在CSDN博客 leoluopy@gmail.com        曾经有一个著名的智力题:有多个版本,如下:(不看答案你能找出结果吗?并找出统一的模型解决问题吗?  亲)        ...

【数学模型】商人们怎样过河?

这篇博文中,同样是一个很简单的数学问题,但是解决起来比上一个的问题要复杂一些。在这次模型求解中,我会使用两种方法,一种是纯粹的数学方法,另一种是通过计算机程序来计算,通过计算机求解我们可以求解一些规模...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)