本作品采用知识共享署名-非商业性使用-禁止演绎 3.0 中国大陆许可协议进行许可。
介绍
Mathematics Genealogy Project是一个面向网络收集数学家家谱资讯的网站。网站上资料来源于该项目自身搜集与网友提供。资料包括数学家的学生,数学家的导师,毕业年份,毕业学校,国籍,研究领域等。目前收集到的资料将近20万笔,并且还在不断增加中。
我们从该网站上抓取所有(实际上并不是所有的)的数学家资料并绘制成网络图,旨在分析数学界中的聚类情况与师生间继承关系;同时还可研究数学科学的发展历程以及数学教育与国家经济发展和时代发展的关系,期望以这样的资料分析科学发展的模式和轨迹(实际并没有这么高大上)。
资料收集
所有的数学家资料是一棵树的结构,也可以用图表示,一个数学家就是一个节点。因此从一个数学家开始,遍历该数学家所有的学生以及他的导师,然后针对他的导师和每一个学生再重复上述步骤,与深度优先遍历类似。首先使用一个队列存储所有待遍历的节点(数学家),以此获取他的学生列表,导师列表,国籍,毕业学校,毕业年份,研究领域等。然后不断重复上述过程,直到队列为空为止。
资料收集过程使用python语言,使用了bs4和selenium来crawl资料,使用了networkx来构造图。定义了一个类Scientst来存储节点的属性。完整的代码见最后。
资料分析
最后收集了1871~2010年间的数学家关系图,原始数据一共64019个点。但有些节点缺少年份和国籍信息,最后分析时过滤掉没有年份属性和国家属性的数据,以每十年为一个阶段分析。下面选取几个时段进行分析。
1871-1890年
网络图如下图所示。箭头连接的两个节点表示两个数学家是师生关系,箭头指向的节点表示这个数学家是学生。此时德国在数学界的发展雄霸天下。
图中红色表示德国,绿色是波兰(只有一个点),蓝色是美国。
1871-1900年
此时正值一战前夕,德国数学家的比例仍占绝对优势,也可以看到一些德国数学家是某些美国数学家的指导教授。有趣的是后来国际数学学科的中心渐渐由德国偏向美国,而一些美国数学家的导师是德国人,或者说是后来很多德国数学家都移民去了美国?
1871-1910年
一战前的十九世纪末期,产生了集合论形成了现代数学的基础。德国数学家D. Hilbert提出了著名的23个问题,几乎左右了本世纪数学发展的进程。其中大约有三分之二以解决或基本解决的问题都伴随着一个个新学科的发展。
如下图所示,上图是该时期的数学家图谱,下图是该图betweenness示意图,节点越大表示betweenness值越大。本时期的核心人物就是D. Hilbert,Klein (克莱因)和Minkowsiki (闵科夫斯基)。闵科夫斯基就是betweenness图中最大的节点。
betweenness示意图:
1871-1920年
该时期恰逢一战爆发。图中绿色节点表示德国,红色是美国。betweenness图中节点最大的数学家名叫C.L. Ferdinand Lindemann,同时他也是这段时期所带学生最多的数学家,学生数量为45个,该记录直到1960年之后才被美国数学家打破。如下表所示。
表1:各时段各数学家学生数量
out-degree | 1871~1900 | 1871~1910 | 1871~1920 | 1871~19300 | 1871~1940 | 1871~1950 | 1871~1960 | 1871~1970 | 1871~1980 | 1871~1990 | 1871~2000 | 1871~2010 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
largest out-degree | 12 | 35 | 43 | 45 | 45 | 45 | 45 | 51 | 63 | 65 | 65 | 105 |
largest out-deg. name | C.L. Ferdinand Lindemann | C.L. Ferdinand Lindemann | C.L. Ferdinand Lindemann | C.L. Ferdinand Lindemann | C.L. Ferdinand Lindemann | C.L. Ferdinand Lindemann | C.L. Ferdinand Lindemann | Patrick Ledden(US) | David Blackwell | David Blackwell | David Blackwell | C.C.Jay Kuo |
可以清楚看到这段时期C.L. Ferdinand Lindemann的学生都是的国人,但其学生的学生有外国人(蓝色节点)。而之前提到的D. Hilbert就是C.L. Ferdinand Lindemann的学生。
betweenness示意图:
1871-1930年
一战结束,百废待兴。1920~1930年十年间,betweenness最大的数学家被Maxime Bocher取代。Maxime Bocher的betweenness最大的记录一直到1980年之后才被美国数学家Joseph Doob打破。如下表所示:
表2:各时段betweenness
betweenness | 1871~1900 | 1871~1910 | 1871~1920 | 1871~19300 | 1871~1940 | 1871~1950 | 1871~1960 | 1871~1970 | 1871~1980 | 1871~1990 | 1871~2000 | 1871~2010 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
largest betweenness | 1355 | 3560 | 3560 | 7994 | 26152 | 93587 | 198013 | 337041 | 679789 | |||
largest btw. name | C.L. Ferdinand Lindemann | Maxime Bocher | Maxime Bocher | Maxime Bocher | Maxime Bocher | Maxime Bocher | Ma |