大数据5v指的是什么?——以沃尔玛为例

Volume

大量的。大数据中数据的采集、存储和计算的量都非常大。那么大数据究竟要多大呢?正常的计算机处理4g数据需要4分钟的时间,处理1TB需要3个小时的时间,而达到1PB的数据需要4个月零3天的时间,起始计量单位只有达到PB的数据才可以被称之为大数据。

沃尔玛是当今最早开始投资和部署大数据应用的传统企业巨头之一,也因此从中获利。大数据使沃尔玛改变了重复销售的决策,这带来了10%到15%在线销售的明显涨幅,增加收入10亿美元。沃尔玛自己有一个庞大的大数据生态系统。沃尔玛每小时约有100万笔交易,大数据生态系统每天处理TB级的新数据,和PB级的历史数据,还需要分析数以百万计的产品数据、数以亿计的客户和搜索关键词。

Velocity

高速,什么又称之为高速?就上面的例子而言就处理1PB的数据不到1秒就可以实现,这就是高速,为什么要有高速,是因为数据也是有一个时效性的,超过了某段时间后,数据就会失去其作用和价值。数据增长速度快,因此处理速度也要快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。

通过社交媒体分析来提高运营效率和销售收入看起来非常诱人,但沃尔玛要完全完成这点还面临一大考验:社交网络中信息产生的数据流速度很快,也就是通常说的“快数据”,用传统的技术手段无法对“快数据”进行有效的分析。如今社交媒体是增长最快的的大数据源,像微博、Twitter这类的社交媒体产生的不仅是“大数据”还是“快数据”,具有很强的时效性。而为了解决这个难题,沃尔玛实验室开发出了特别的解决方案和技术,通过大规模的服务器集群对“快数据”流进行极其高速的处理。现在沃尔玛每天能处理数以十亿计的社交媒体更新信息。

Variety

就是种类和来源多样化。包括结构化、半结构化和非结构化数据。随着互联网和物联网的发展,又扩展到网页、社交媒体、感知数据,涵盖音频、图片、视频、模拟信号等等,真正诠释了数据的多样性,也对数据的处理能力提出了更高的要求。

就如前面所说沃尔玛也十分重视从Twitter、Facebook等社交媒体获取数据。并且在进入Web2.0时代后,相较于以往Web1.0用户被动地接受信息,现在主动权掌握在了用户手中,用户可以上传、分享自己的原创信息。网站和用户有了很好的交互。这也使得这些年来,网络数据量呈现出了爆炸式的增长。但是也是因为这些技术和思想的进步和发展使大数据涵盖了更多涉及方方面面的内容,丰富了大数据对数据的采集和获取的方式。

Value

就是获取有价值的数据。如果用石油行业来类比大数据分析,那么在互联网金融领域甚至整个互联网行业中,最重要的并不是如何炼油,而是如何获得优质原油。最重要的就是挖掘更多有价值的信息。因为大数据中数据价值密度相对较低,可以说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。

而沃尔玛很出色地对数据进行了挖掘和利用。沃尔玛每天有超过40PB的数据可供分析,在如此庞大的数据集中,有用价值的密度其实是很低的。但是沃尔玛运用一切技术提取信息,为企业在决策前将成本降到最低,并创造新的消费机会。

举个例子,小明是沃尔玛的老顾客了,而他在近几年购买商品的品种、数量、型号、时间信息、支付方式信息、商品配送信息、会员卡信息、住址、联系方式,甚至小明在沃尔玛商场购物的监控视频、门禁数据等线下消费信息都已经被沃尔玛的信息系统详细记录。那这些数据有什么用呢?

当小明来到沃尔玛商场时,他手机上的沃尔玛APP可能已经收到了来自购物清单中八成的商品信息和优惠券信息。当小明买好东西,用手机支付时,在移动支付完成的瞬间,沃尔玛已经在数据端开始更新小明的消费信息,并开始预判小明在下次购买某些商品比如啤酒、牛奶的时间和数量。最后将数据提交给APP的推荐业务。

在商场购物时,小明还看重了一款网球拍,但是没有加入扫描清单也没有购买。这时他或许不知道,就在他旁边的那个塑胶运动模特的脑袋里的摄像头记录下了他当下的一举一动,包括他的表情变化、在此停留的时间长短、试拍是右手握拍还是左手握拍等等一系列的细节。到了第二个月,小明手机的推送信息里就多了沃尔玛推荐的性价比更高的一款球拍。

有天,小明不想出门购物了。于是他打开沃尔玛的网上商场,cookie自动登录并显示自己上次登录的时间。在小明的购物首页推荐上有会员八折优惠的某款网球拍,还有一款全钢特价的西门子榨汁机。小明会心一笑:邻居王叔叔昨天在Twitter上抱怨自家的榨汁机真差劲时,小明顺手点了个赞。没想到沃尔玛就都知道了!随后小明又注意到自己在Facebook上唯一关注的某音乐人的新专辑已经发行售卖,这让小明很是心动。另外,自家附近的一家健身房的年卡正在打折出售,小明摸了摸肚子上的赘肉发出一声叹息,心想:沃尔玛你TM怎么知道这么多!

从这个小例子看出,通过大数据对数据的挖掘和利用,沃尔玛为自己的用户带来便利和个性化的用户体验,也为自己的运营带来了可观的销售增量。

Veracity

就是真实性。大数据中的内容是与真实世界中的发生息息相关的,要保证数据的准确性和可信赖度。研究大数据就是从庞大的网络数据中提取出能够解释和预测现实事件的过程。

其实这部分也在上面Value的部分已经有所体现。通过大数据的分析处理,最后能够解释结果和预测未来。但是前提是提取的数据要足够的准确性。沃尔玛通过大数据获取并分析用户提供的信息,可以知道用户独特的需求和喜好,并能够预测出用户下一步动作,并在用户行动前向用户推送信息。

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
今天,电子商务是全球最新的商业交易方式。 互联网、网络和卫星技术等不断发展的创新使公司能够转向在线业务。 今天,电子商务对改变世界各地人们生活方式的文化产生了无限的影响。 这对制造商、分销商、经销商、批发商和客户产生了巨大的影响。 在过去的 6 年里,有很多企业挺身而出,开始电子商务业务,因此 80% 的公司取得了巨大的市场成功。 如今,电子商务的进步在很大程度上仍在继续,因为现在公司必须进行数据分析以应对市场。 通过互联网进行交易时,会在广告、信息交换、订单和支付、交付、客户支持、客户评论等各个方面产生大量数据。 公司面临的主要挑战是如何利用数据进一步改进产品。 这些公司现在正在创建一个研究部门,使用不同的技术进行数据分析,为公司的利润做出良好的贡献,帮助公司做出正确的决策。 沃尔玛是美国最大的供应商,并在全球 28 个国家/地区扩大了市场。 现在,由于来自其他公司的激烈竞争,它正在努力保持领先地位。 因此,它有预谋地使用过去几年的大量现有数据集,并通过专门的研究团队对其进行分析。 本文研究了电子商务行业的各个要素,电子商务中可能产生的数据列表,电子商务中数据分析的需求,电子商务中进行数据分析的挑战,实现所需的技术电子商务中的数据分析,公司如何使用数据集在市场上生存以及沃尔玛公司如何执行数据分析以了解业务场景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值