大数据如何影响统计思维的转变?

大数据观点一经提出,便引起了全球广泛的反响,似乎所有的商业或组织活动都可视为大数据问题。大数据时代的到来,必然对社会经济各个方面产生重大冲击,对与大数据紧密相关的“统计”又会产生什么样的影响呢?统计学是关于数据的科学,即研究如何收集、整理和分析数据的科学。数据是依据,是灵魂,是统计方法生命力的根源所在,大数据时代的统计首先要适应三个重大的思维转变。

01 分析与事物相关的所有数据,而不是依靠分析少量的样本数据

640?wx_fmt=jpeg

统计往往希望用尽可能少的数据来证实可能重大的发现、假设等,小数据时代一般采用随机采样,用最少的数据获得最多的信息。统计抽样是在技术受限的条件下,解决当时存在的一些问题而产生的;如今的大数据时代,计算和制表不再像过去那样困难,感应器、手机导航、网站点击和微博等能够收集大量数据,而计算机也能够轻易处理。因此,在处理大数据时不再来用随机抽样的方法,而利用所有数据进行分析。


例如:谷歌流感趋势预测并不是依赖于对随机抽样的分析,而是分析了整个美国几十亿条互联网检索记录而得到的结论。分析整个数据库,而不是对一个样本进行分析,能够提高微观层面分析的准确性,甚至能够推测出任何特定尺度的数据特征。

02 乐于接受数据的纷繁复杂,而不再追求精确性


640?wx_fmt=jpeg

对小数据而言,最基本、最重要的要求是减少误差,保证数据质量。生活于信息时代的我们,掌握的数据越来越全面,不再只包括手头现象的一点点可怜数据,而是包括了与之相关的大量级数据甚至全部数据。


人们不再那么担心某个数据点对整套分析的不利影响,要做的是接受纷繁的数据并从中受益。大数据要求人们能够接受混乱和允许不精确性,例如一个小商店晚上打烊的时候要把收银台里的每分钱都数清楚,但如果用“分”这个单位来精确计算国内生产总值显然不适用。大数据时代,随着数据规模的扩大,人们对数据精确度的痴迷将逐步减弱。

03 不再探求难以捉摸的因果关系,转而关注事物的相关关系

在小数据时代,人们往往乐此不疲地想知道现象背后的原因。大数据时代,由于坐拥海量数据和良好的机器计算能力,相关关系分析为人们提供了一系列新的视野和有用的预测,能够找出新种类数据间的相互联系来解决日常需要。


例如:如果电子医疗记录显示橙汁和阿司匹林的特定组合可以治疗癌症,那么找出具体的致病原因就没有通过相关关系而获得的这种治疗方法来得重要;亚马逊根据用户在其网站上的类似查询来进行产品推荐,也是大数据相关关系的典型应用。通过探求“是什么”而不是“为什么”,能够帮助人们更好地了解这个世界。

转自:中国统计网

 End.

转发此文到朋友圈并截图到后台,

获得20Gpython入门视频课

以及BeautifulSoup中文文档

往期实战及福利


  1. 关注本公众号,牧原小主 送您

    1.  2.7G  380份最新数据分析报告

    2.  40G  人工智能算法课

    3.  已关注的小伙伴,直接回复数据分析报告、人工智能算法

  2. 关注后,回复 PM2.5 获得 Python分析北京PM2.5,原来每年的值都在变少...所有源代码

  3. 关注后,回复“python3.7”,获得python 3.7官方最新pdf 文档

  4. 关注后,回复 世界杯, 获得 2018世界杯来了,利用Python预测冠军(附全部代码和数据集)所有源代码

  5. 关注后,回复“豆瓣电影“,获得 Python实战 | 手把手教你爬取豆瓣电影 Top 250(附全部代码及福利哦)所有源代码

  6. 关注后,回复“python可视化”,获得 利用python“三步”实现数据可视化,炫的不要不要的!所有源代码

长按二维码,关注我们

640?wx_fmt=jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值