[离线数仓]一、用户行为采集平台

G:\Bigdata\Projects\大数据项目之电商数仓V6.0

第1章 数据仓库概念

        数据仓库( Data Warehouse ),是为企业制定决策,提供数据支持的。可以帮助企业,改进业务流程、提高产品质量等。
        数据仓库的输入数据通常包括:业务数据用户行为数据爬虫数据
        业务数据:就是各行业在处理事务过程中产生的数据。比如用户在电商网站中登录、下单、支付等过程中,需要和网站后台数据库进行增删改查交互,产生的数据就是业务数据业务数据通常存储在MySQL、Oracle等数据库中。
        用户行为数据:用户在使用产品过程中,通过埋点收集与客户端产品交互过程中产生的数据,并发往日志服务器进行保存。比如页面浏览、点击、停留、评论、点赞、收藏等。用户行为数据通常存储在日志文件中。
        爬虫数据:通常是通过技术手段获取其他公司网站的数据。

第2章 项目需求架构设计

2.1 项目需求分析

1)采集平台

(1)用户行为数据采集平台搭建

(2)业务数据采集平台搭建

2)离线需求(31个指标)

主题 子主题 指标
流量主题 各渠道流量统计 当日各渠道独立访客数
当日各渠道会话总数
当日各渠道会话平均浏览页面数
当日各渠道会话平均停留时长
当日各渠道跳出率
路径统计 路径分析
用户主题 用户变动统计 流失用户数
回流用户数
用户留存统计 新增留存率
用户新增活跃统计 新增用户数
活跃用户数
用户行为漏斗分析 首页浏览人数
商品详情页浏览人数
加购人数
下单人数
支付人数
新增下单用户统计 新增下单人数
新增支付成功人数
最近7日内连续3日下单用户数
商品主题 *复购率统计 最近30日各品牌复购率
各品牌商品下单统计 各品牌订单数
各品牌订单人数
各品类商品交易统计 各品类订单数
各品类订单人数
购物车存量统计 各分类商品购物车存量Top3
各品牌商品收藏次数Top3
交易主题 订单支付时间统计 下单到支付时间间隔平均值
各省份交易统计 各省份订单数
各省份订单金额
优惠券主题 优惠券使用率统计 使用次数
使用人数

3)实时需求(46个指标)

主题 子主题 指标
流量主题 各渠道流量统计 当日各渠道独立访客数
当日各渠道会话总数
当日各渠道会话平均浏览页面数
当日各渠道会话平均停留时长
当日各渠道跳出率
流量分时统计 当日各小时独立访客数
当日各小时页面浏览数
当日各小时新访客数
新老访客流量统计 各类访客数
各类访客页面浏览数
各类访客平均在线时长
各类访客平均访问页面数
关键词统计 当日各关键词评分
用户主题 用户变动统计 当日回流用户数
用户新增活跃统计 当日新增用户数
当日活跃用户数
用户行为漏斗分析 当日首页浏览人数
当日商品详情页浏览人数
当日加购人数
当日下单人数
当日支付成功人数
新增交易用户统计 当日新增下单人数
当日新增支付成功人数
商品主题 *复购率统计 最近 7/30 日截至当前各品牌复购率
各品牌商品交易统计 当日各品牌订单数
当日各品牌订单人数
当日各品牌订单金额
当日各品牌退单数
  • 11
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值