什么是大数据?大数据能做什么?

  随着信息技术的不断发展,大数据越来越受到人们的重视,为什么大数据成为人们关注的焦点?毫无疑问,它能给人们带来价值。随着信息的迅速发展,每个人的日常活动都被记录为各种数据。通过对某些规则的处理和筛选,我们最终可以获得一些有利于社会发展和企业运营的经验,这就是大数据的价值所在。


  01什么是数据


  谈及大数据,就不得不说到数据。什么是数据?我们每天接触到的文字、图片、音频、视频,这些都是数据。数据并非是一张张统计表,一个个直方图。


  02数据的类型


  数据类型可分为三种,即结构化数据、半结构化数据和非结构化数据。结构化数据指的是我们在小数据时代的二维表,这种数据一般存放在关系型数据库中,结构化数据每一行作为一个样本,而每一列则是样本的属性值。非结构化数据指的是图片、音频和视频等,变化多样,难以用传统的结构来规范和描述这类数据。而半结构化数据,它介于结构化数据和非结构化数据之间,有其自身的特点,如html、xml文档,它们不是二维表的形式,但是必须由自身语义定义的首位标识符来表达和约束其关键内容。


  大家日常接触到的数据,大部分都是非结构化数据。例如朋友圈的自拍,语音和小视频,这些非结构化数据由于其自身的多模性和异构性,只有将非结构化数据转换成结构化数据,才能被处理和分析,展现其中的价值。


  03大数据特征


  一般谈到大数据,我们都会从它的4V特征讲起,即大量(volume)、多样(variety)、时效(velocity)、价值(value)。


  (1)大量(volume)


  规模巨大是大数据的首要特点。大数据的“大”,是毋庸置疑的,它往往指PB级别以上的数据,如EB、ZB等。随着互联网行业的迅猛发展,越来越多的人可以通过终端特别是移动终端进行互联网活动,人们的各种行为如发微博、点赞、下载文件等,都会产生一条条的行为数据,另外一方面随着物联网的发展,物物相连,这些底层的设备之间也会产生大量数据,而今的储存技术的发展,是其成本不断下降,也为这些数据的存储开创了条件,进而使得大数据规模巨大。


  (2)多样(variety)


  大数据数据多样,而且结构差异性较大。前文提到数据可分为结构化数据、半结构化数据和非结构化数据。而在不同的背景下,人们所需的数据可能是文本、音频、图片等多种类型的,这也造成了大数据的多样性。


  (3)时效(velocity)


  时效性是大数据的又一重要特征。当今社会互联网迅速发展,数据的产生和传播能力十分强大,这就需要我们实时的对大数据进行有效的处理。


  (4)价值(value)


  价值是大数据的特点,也是其存在的重要意义。通过对大数据的分析和挖掘,能够为企业业务发展提供良好的辅助支撑作用,推动社会的进步和发展,这也是大数据能够立足的根本。


  大数据通过大量数据的收集与分析,可以做出预测性分析,它已经在各个领域有所作为。例如我们的天气预报,农业、体育和工业等方面,我们可以通过分析与挖掘,得出对人们有价值的信息,从而推进社会的发展进步。


   什么是大数据?大数据能做什么?中琛魔方大数据表示任何事物都有其两面性,虽然大数据具有很高的价值,但它也有其自身的缺点。因为大多数数据是非结构化数据,所以它的数据密度很低,有价值的数据只是其中的一小部分,这对我们的处理和筛选方法提出了很高的要求,而数据治理正是为了解决这一问题。

中琛魔方大数据平台 www.zcmorefun.com


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/69936596/viewspace-2655089/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/69936596/viewspace-2655089/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值