第2期 数学与统计学的神秘关系

上一期,笔者大致阐述了数学的大致分类,很多人也许会意识到我没有把统计学列入其中。这一期,我们就来跟大家好好地缕一缕它们的关系。

我发现很多人其实并不清楚统计与数学的关系,甚至出现了“统计学就是数学的一部分”,或者“概率论与数理统计就是统计学”等不恰当的观点。这些观点在国内还挺常见的,也有类似的现象比如很多大学都将统计学设置在数学学院下,相比国外的话,统计与数学是独立的,而且统计已经是一门比较成熟的学科门类了。其实国内统计学起步较晚,近十年来,大数据、人工智能、大数据等异常火爆(我也是因为这个才选了统计专业,允悲),部分大学才开始设立统计与大数据科学学院(比如南开、最近的人大刚成立)、统计研究中心,而且将统计学与数学设置为并列的两个一级学科。其实出现这样的观点也不能怪谁,谁让本来数学就与统计学关系十分密切。

首先,我们从源头上来分析这两个学科,数学始于演绎,统计始于归纳,这里我用图例来说明何为演绎(三段论模式,现有一个大前提,对应于一个结论;如果此时有个小前提满足大前提,那么也就可以得出结论。就如根据数学的几条公理,演绎出了现在丰富多彩的数学世界),何为归纳(考察个别事物,推出普遍事物的规律)。

这里还有段英文,比较形象地阐释了统计学:

Statistics is the science of collecting, analyzing, presenting, and interpreting data. Governmental needs for census data as well as information about a variety of economic activities provided much of the early impetus for the field of statistics. Currently the need to turn the large amounts of data available in many applied fields into useful information has stimulated both theoretical and practical developments in statistics.

— Encyclopedia Britannica

给大家做了翻译:

统计学是收集,分析,呈现和解释数据的科学。政府对人口普查数据的需求以及关于各种经济活动的信息对统计领域提供了很多早期的推动。目前在许多应用领域对转换大量数据为有用的信息的需求刺激了统计在的理论和实践发展。

- 大不列颠百科全书

接着我们从学科门类上对它们进行分别,数学学科就如上期那样,有大致五个学科门类(数学教育暂时就不列入了)

  • 基础数学

  • 运筹学与控制论

  • 计算数学

  • 概率论与数理统计

  • 应用数学

而统计学分为

  • 数理统计学

  • 应用统计学

有些人看到这里,可能就会问,那数学的“概率论与数理统计”与统计学的“数理统计学”又有什么区别呢?是这样的,要说两者完全没关系是不可能的,只是两者的侧重点有所不同而已。前者侧重于概率论,偏数学,后者侧重于数理统计,偏统计;总的来说,两者都偏理论。就像你们学习的概率论基础与数理统计一样,可以比较直观地看出两者的关系。

然后,大家也许会问,那“大数据”、“云计算”、“人工智能”、“深度学习”、“数据挖掘”与统计又有什么关系呢?下面听我细细道来。

“大数据”相比较于我们传统意义上的“小数据”,据统计,截至2012年,全世界每天产生2.5艾字节( 2.5×1018字节)的数据。也许现在会更多,每天产生数据的量级十分巨大,随之而来就会产生数据的存储、计算问题,即所谓的“云储存”、“云计算”。我们都知道,现有普通计算机都采用浮点运算,量级相比巨量的数据显得十分有限,从而针对普通计算机的算法必须改进乃至重新设计以达到新的要求。

说来也是可笑,如果说“偷懒”是促进社会科技发展的一个重要因素,那应该没有人会反对吧。让机器逐渐地来替代人力劳动,是现代社会发展的必然趋势,也必将是人类科技达到的一个新高度。然而,有限就是有限,学过数学的人或多或少的知道,它跟无限有着本质的区别(就如我在上期文章中所讲“数学就是现实生活的极限”),虽然不可达,但可以做到很好的逼近,只要达到我们的要求就行了。

由此“人工智能(AI)”这个概念油然而生,虽然这个概念很早就被提出,在九十年代火了一段时间又渐渐沉寂,在21世纪的今天,它又被人们提起,并再次进入大众的视野。那么上面的概念通通与统计密不可分,当然,计算机是必须的工具。就拿”数字识别“来举例,一开始会将手写数字的图片放大至一定分辨率(此时都是小方格),按照一定的规则排列成条,构成数学中的向量,何时为真实数字,何时为错误,然后设计算法,设定惩罚,进行数据集的训练,然后改进算法,进而达到需求。

还有一点很重要的是,如果你要做很好的“大数据”,离不开很好的数学,离不开熟练的编程。遗憾的是,现在流行的这些概念,其实质上只是很小的进步,并没有发生质的飞跃,这是由于数学以及计算科学的的发展可以说是进步缓慢,只是由于再次被提及,用的比较多广泛而已。所以可以这么说,统计受数学影响很深。而且由于“5G”技术的突破,今后,“物联网”这个新概念的应用,将极大地促进“大数据”、“云计算”等的进一步发展。

最后,以一张图来作为全文的总结

希望大家多多支持(素质三联一波塞),这将是我为你们继续创作的动力所在。如果大家对我的文章感兴趣的话,可以点赞、关注、收藏支持一波,也可以关注我的专栏。下期见!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Rainsley_Math

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值