大数据三个特点的理解

本文探讨了大数据的三大特点:全数据而非样本、接受数据混杂性、关注相关关系而非因果关系。作者强调,大数据不仅是数据量的增大,更是思维方式的变革,要求我们关注全体数据、接纳错误数据,并通过相关性进行预测。尽管相关性提供了新的洞察,但对因果关系的追求仍然是重要的理论基础。
摘要由CSDN通过智能技术生成

写这篇文章始于对维克托前辈《大数据时代》的理解与思考,大数据的浪潮已经一波一波地拍打在中国的土地上,各行各业都在积极的探索与这一技术的接轨和发展的机遇,所以能够见证并亲历这一个变革技术的时代我们这一代是幸运的。之所以说大数据时代是一次变革,不光是其技术进步所带来的,其伴随的思维冲击与变革也是前所未有的。这些对于大数据时代到来的赞美之词,在追捧大数据的人群中可以说是声音此起彼伏,溢于言表。但是根据我身临其境的观察发现人群中的声音有不乏少数的嘈杂与偏颇,所以想写一篇文章来表述自己的理解以及和网友前辈们进行相关的交流。

维克托前辈在《大数据时代》中提出了大数据所具有的三个特点:

  • 数据更多:不是随机样本,而是全体数据。
  • 数据更杂:不是精确性,而是混杂性。
  • 数据关系:不是因果关系,而是相关关系。

以下分别简述我对其的理解。

一、数据要全体不是样本

大数据的大是指所研究的数据集是数据的全体,而非随机采样得到的样本。可是大部分人会惯性地认为大数据的大就是比现有的数据更多更大的一个绝对量,而不会有数据全体的概念,也就是说如果我们研究的数据全体只有MB的数量级,那么我们的研究也是大数据范畴。这一惯性的认为始于以前小数据时代的采样统计学分析的延续,彼时的统计学家们证明出:采样分析的精确性随着采样随机性的增加而大幅度提高。但与样本数量的增加关系不大,也就是当样本的数量达到某个值之后,从新个体身上得到的信息会越来越少。这一特性弥补了我们当时无法获取和处理更多数据的缺陷,但是在我们的心底,对于获得更多更精确数据的愿望是不曾黯淡过的。

历史不足一百年的统计抽样分析被习惯看作是文明得以建立的基石之

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值