大数据和数据分析领域除了4V,还应该有更重要的第五个V

“大数据”从之前的难以理解,到渐渐地融入到了我们的生活当中,如今数据无时无刻,随时随地被挖掘同时也在被使用。对于不同的人大数据意味着许多不同的东西,如果是从技术的角度观察大数据,而不是商业角度或行业角度,大数据的理解是有所不同的。

从本质上讲,大数据(并不是很好的描述)可以描述成两个主要现象:

我们现在正以惊人的速度生成新数据

我们提高了存储,处理和分析数据的能力

我们一直使用4个V来描述大数据:体积、速度、多样性和准确性。值得一提的是,这些数据和我们使用这些数据的能力也在增强,下一步将其转化为Value,这是本文所说的第5个大数据V。

接下来我们先了解下4V:

体积指的是每秒产生的大量数据。想象一下我们每秒生成和分享的文件、照片、视频等等的数据量。现在谈论不在是TB,而是zettabytes甚至是brontobytes数据量。如果我们从世界开始时到2000年时的所有数据加起来,和我们现在每分钟产生的数据是一样的!这使得数据集越来越大,无法使用传统的数据库技术存储和分析。在借助了大数据技术后,我们现在可以在分布式系统的帮助下存储和使用这些数据集,且可以把部分数据存储在不同的位置上,通过网络连接,或通过软件连接在一起。

速度是指生成新数据的速度和数据移动的速度。试想一下,社交媒体消息在几分钟内迅速传播,检查信用卡交易是否存在欺诈行为的速度,或者交易系统分析社交媒体网络接收到触发买卖股票决定的信号所需的毫秒。现在大数据技术还可以做到我们在生成数据时实时进行分析数据,而无需将其放入数据库中。

多样性指的是我们现在可以使用的不同类型的数据。在过去,大部分关注于结构化数据,这些数据非常适合表格或关系数据库,比如财务数据

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值