大数据BI系统如何做数据采集

  随着数据量的不断增速,数据价值也逐渐被很多公司所关注,尤其是偏重于业务型的企业,大量数据的产生,在未被挖掘整合的过程中通常被看作是一堆无效且占用资源的;但一旦被发掘,数据的价值将无可估量。尤其像电商,银行,服务行业等等。

大数据BI系统如何做数据采集

 

  数据采集系统故名思意就是将数据从数据源采集到能够支撑大数据架构环境中,从而实现数据的采集以便后期对数据的二次加工建立数据仓库。

 

  一、业务流程梳理

 

  在业务流程梳理的过程中,我们先预设个场景,如:

 

  当公司运营人员提出一个订单转化率的需求,作为产品人员,首先要确定分析订单转化率与哪些因素有关,最终确定从用户下单,支付这两个环节中分析,如当月有多少用户提交了订单,之后有多少用户确认了订单,有多少用户最终支付订单等;最终呈现了漏斗形的分析主题;因此分析时就需要确定所需要的这些数据要从哪些表获取,都需要获取哪些数据,获取到后要采集存储到哪个数据仓库的表中,最终被使用到。

 

  因此从上面的例子中我们可以从以下几点思考业务流程:

 

  确定主题,确定主题模型;

 

  确定表和数据口径;

 

  确定需要与目标的映射关系;

 

  确定表与口径需要从哪些源下获取,以及如何数据更新的频率等&

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值