大数据概述及6V

本文概述了大数据的不确定性定义,强调其主要特征包括数据量大(Volume)、多样性(Variety)、快速增长(Velocity)、低价值密度(Value)、真实性/价值(Veracity)和连通性(Valence),以及衍生出的可视化、动态性和合法性等。讨论了这些特征对大数据产业的影响和相关岗位发展。
摘要由CSDN通过智能技术生成

概述

  1. 大数据从面世以来,不同的机构、组织都试图对大数据做出定义,但是到目前为止,大数据并没有产生准确的定义,达成了共识:大数据是围绕海量数据来进行处理分析,从而挖掘数据的价值

  2. 虽然大数据没有准确定义,但是总结出来大数据的几个特征

  3. 对于整个大数据产业而言,大概可以划分为数据采集(日志采集、业务数据采集、爬虫等)、数据存储、数据分析(离线、实时)、数据挖掘、数据可视化

6V

  1. Volume:数据量大,包含数据采集、存储、分析量都很大。中小型企业的日数据量大约在GB~TB级别,大型企业的日数据量大约在TB~PB级别

  2. Variety:数据来源、种类和样式多。随着网络的发展,数据的来源越来越多样化,种类也越来越多样化(文字、图片、视频、音频、流媒体等),样式也多样化(结构化数据、半结构化数据、非结构化数据)

  3. Velocity:数据增长速度快。随着网络的发展,数据的增长速度是越来越快的。根据科学家的估计和计算,全球的数据总量每3-5年会翻一番

  4. Value:数据价值密度低。随着网络的发展,数据总量越来越大,那么需要的数据在数据总量中的占比就越来越低,也就意味着数据价值密度在变低

  5. Veracity:数据的真实性/价值。互联网上的数据/信息良莠不齐,导致数据的质量也参差不齐

  6. Valence:数据的连通性。随着大数据的发展,大数据也衍生出不同的岗位和模块,此时就需要考虑不同模块之间的关联

  7. 随着大数据的发展,衍生出其他的特征:Visualization(可视化),Vitality(动态性),Validity(合法性)等

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值