海量实时用户行为数据的存储和分析

本文探讨了海量实时用户行为数据的挑战,强调了行为数据的重要性,并介绍了处理这种数据的两种方法:物化视图和实时聚合。重点提出了数据存储的四个关键点:原始数据存储、实时多维查询、快速响应需求和数据探索分析。此外,介绍了一个基于Hadoop加速引擎的平台,该平台支持实时接入、多维分析和二次开发,适用于大数据的BI、挖掘和预测分析。
摘要由CSDN通过智能技术生成

在短时间内爆发大量数据,这时数据资源的采集、存储和分析和应用等,都是大数据行业的难点。行为数据、日志数据的处理,往往成为企业数据建设首先面对的瓶颈,这些数据不易保存,实时获取分析难度较大,但是数据价值却不可估量。

在大数据中,90% 以上的数据爆发来自于行为数据,就像现在的互联网、移动互联网、甚至在产生于物联网中用来描述人和物的每一分每一秒的变化的数据状态,这些都是行为数据。

行为数据能用做什么?

海量实时用户行为数据的存储和分析

行为数据能做什么?有一个简单的例子 —— 分析访客行为的路径,我们拿一个网站的数据进行分析,针对网站的访客,我们可以通过分析其访问前期、中期、后期的行为习惯去了解哪些引流的渠道需要加强投入,以及使用这些来指导内容编辑和竞品研究分析工作。

实际上在做需求时,还有更多的细节要求如:对数据的实时性的要求比较高、要求数据的热点情报的准确性、与客户数据的协同分析等。

行为数据的处理方式

海量实时用户行为数据的存储和分析

用户行为数据通常具备以下特征:

  • 用户基数大;
  • 高基数维度比较多;
  • 数据量大;
  • 时序的特征。

我们用到的高基维,其中有些维度都是上千万的高基维参数。用户行为数据的处理,在支持原始数据查询的同时,也要支持原

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值