大数据中的“大”究竟指什么?

有一个深深值得相信的理论见识决定命运。


一个重要提升见识的方法就是学习。那么,究竟怎样学习呢?其实是有方法的。


一本厚厚的书,最重要的其实就是那么些概念,不算多。书的作者往往讲一个概念就花费一个章节的篇幅,从内容和结构上来看,其实讲的都差不多,无非是从不同的角度阐述这个概念,从而说清楚它是什么,它不是什么,以及它和别的概念什么异同,或是相关联的地方。


接下来就开始叙述与这个概念相关的方法论,以及使用这个概念的时候需要注意什么问题,怎样使用是正确的,怎样使用是错误的,容易发生错误的地方是什么,容易产生误解的地方,等等。包括教科书中课后的各种习题,实际上都是为了这个目的。


有了这样的认识之后,我们在学习的理念上就领先于他人了,这是最基本的能力,就像运动员的体能一样。后面的学习过程只不过是进一步扩大这种认识而已。


所以大家应该知道,我们为什么不厌其烦地强调基本概念的重要性。因为这就是我们通向知识财富道路上的一个有效的路径,虽然不能称之为捷径,但绝对是一种非常有效的方法,每个人都应该掌握它。


不同的学科可能拥有不同的知识体系,但是都需要花费时间在基本的概念学习上。就像体能训练,为的就是能够保持自己的竞技状态。如果没有这些基本的体能储备,到了后面的学习估计就只能气喘吁吁看着其他对手在场上奔跑,在学习中进步了。所以我们千万不要因为短期的好高骛远忽视了这个最基本的体能训练。


大数据的学习同样如此。每个人在学习过程中,大概首先要问到的一个概念就是:大数据中的“大”究竟指什么?




其实,是可以通过分析它的英文名称来理解的。英语课里常见的表示大的单词有两个:large和big,它们都是大的意思。那为什么大数据使用“big data”而不是“large data”呢?而且,在大数据的概念被提出之前,有很多关于大量数据方面的研究,如果你去看,会发现这些研究领域里面的很多文献中,往往采用 large或者vast(海量)这样的英文单词,而不是big。例如,数据库领域著名国际会议VLDB(即Very Large Data Bases),里面就是用的large。 




那么,big,large和vast到底有些什么差别呢?large和vast比较好说,程度上的差别,后者可以看成是very large的意思。而big和它们的区别在于,big更强调的是相对大小的大,是抽象意义上的大;而large和vast常常用于形容体量的大小。比如,large table常常表示的是一张尺寸非常大的桌子;而如果用big table,则表示这不是一张小的桌子,至于尺寸是否真的很大倒不一定,这种说法是要强调相对很大了,是一种抽象的说法。 


因此,如果你仔细推敲这种big data的说法,就会发现这种提法还是非常准确的,它传递出来最重要的信息就是大数据是一种抽象的大,是一种思维方式上的转变。现在的数据量比过去大了很多,量变带来质变,思维方式,方法论都应该和以往不同。这个可以看成是帮助我们理解大数据的一把钥匙。


例如,大数据的一个常见定义是:Big Data is data that is too large, complex and dynamic for any conventional data tools to capture, store, manage and analyze. 可以较容易看出,这里的“大”就是一个相对概念,相对于传统数据工具无法捕获、存储、管理和分析的数据。


再例如,在有大数据之前,计算机并不能很好解决人工智能中的诸多问题,但如果我们换个思路,利用大数据,这样在某些领域(例如围棋)就可以突破性解决了,其核心问题变成了数据问题。


大数据中其它的几个重要概念还包括:数据、信息、相关性、多维度、完备性、安全隐私等。我们后面一点点地来辨析。


概念这种东西是非常重要的!

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值