【大数据面试题】28 解释一下大数据的 5V 特性是什么?

一步一个脚印,一天一道面试题。
搞点简单的。

大数据的5V特性是描述大数据本质和特性的五个关键词,它们分别是:

Volume(大量):

指的是数据的总量非常大,通常涉及到TB(万亿字节)、PB(千万亿字节)、EB(百亿亿字节)乃至更高量级的数据。这种数据规模远超过传统数据处理系统的能力范围,需要分布式存储和并行计算技术来处理。
一般来说,使用的Yarn集群的存储都是 PB 级以上的数据,而且有不同集群处理不同业务,大数据的需要的容量是非常庞大,非常烧钱的。

Velocity(高速):

强调数据生成和处理的速度。在大数据环境下,数据以极高的速率持续不断地生成,例如社交媒体更新、传感器数据流等,要求系统能够实时或近实时地处理这些数据流。

Variety(多样):

指大数据包含了多种形式和类型的数据,包括结构化数据(如数据库中的表格数据)、半结构化数据(如JSON、XML文档)和非结构化数据(如文本、图像、音频、视频等)。处理多样化的数据需要灵活的数据处理框架。

Value(低价值密度):

虽然大数据集合庞大,但其中包含的有用信息或知识可能相对较少,即信号与噪声的比例较低。这要求高效的分析方法来提炼出有价值的信息。
就是里面有许多没什么价值的数据。

Veracity(真实性):

涉及数据的质量和准确性。在大数据背景下,数据可能来源于多种渠道,存在噪声、不一致性或错误,因此确保数据的真实性和可靠性是关键挑战之一。

这五个 V 共同描绘了大数据处理的复杂性和挑战,以及对技术支持的需求,如高效的数据存储、快速的数据处理框架、强大的数据分析能力以及数据质量管理措施。

我是近未来,祝你变得更强!

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值