什么是大数据?大数据有
值?
1 天前
——“在人类历史上,我们从未如此迅速,如此轻松地获得如此众多的信息。” (Vint Cerf,“互联网之父”,席尔瓦,2009年引用)
——当今世界90%的数据仅在过去两年中就已产生(IBM,2011年)
人类存储数据能力的提升,带来了数据存储的繁荣,并在极短的时间内用近乎粗暴的方式在21世纪将人类带入了大数据时代。
一、大数据的定义
那什么是大数据呢?麦肯锡将大数据定义为:无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。显然麦肯锡将大数据定义的重点放在了“大”上。诚然,人们最初接触大数据的时候,震撼于大数据爆发性增长所带来的的巨大体量,最强烈直观的感受就是“大”。但随着时间的推移,人们开始分析,挖掘数据,去探索数据背后隐藏的价值,自此数据金矿展露出矿山一角,开始在时代洪流中大放金光,大批淘金者蜂拥而上,更是助推了大数据的蓬勃发展,最终促成了大数据生态系统的形成。
笔者大胆的对时代背景下的“大数据"做出如下定义:以海量数据为基础,以数据的整理、分析、挖掘为过程,并最终以实现数据价值为结果的一整套理论和实践就是大数据。
笔者认为大数据的内在生命力是数据的持续性爆发增长,而外在特征用数据人普遍认同的5V加以描述:
Volume:数据体量巨大。就是大。
Variety:数据类型繁多。繁杂纷复的属性和行为数据以结构化或者非结构化的形式存储在形式各异的存储器上。
Value:价值密度低。数据万千,可提取的价值往往只占万一。更因此,科学的数据挖掘和高精度算法才显得如此重要。</

大数据被定义为无法用传统工具处理的大量数据集合,其特征包括体积大、类型多、价值密度低、处理速度快和真实性。它已广泛应用于智能推荐、生物医学、物流、智慧城市等领域,尤其在营销中,通过用户数据分析实现精准投放和效果评估,赋能企业营销策略。
最低0.47元/天 解锁文章
9009

被折叠的 条评论
为什么被折叠?



