电商用户行为分析需求梳理

该博客探讨了基于Flink的电商用户行为数据分析,包括批处理与流处理的对比,用户行为分析如热门商品统计、风险控制,以及数据源解析。此外,详细介绍了实时热门商品统计、流量统计、恶意登录监控和订单支付实时监控的实现方案。
摘要由CSDN通过智能技术生成

1、基于flink的 电商用户行为数据分析

内容主要有:

  1. 批处理和流处理
  2. 电商用户行为分析
  3. 数据源解析
  4. 项目模块划分

1.1、批处理和流处理

在这里插入图片描述
批处理:

批处理主要操作大容量静态数据集,并在计算过程完成后返回结果。可以认为,处理的是用一个固定时间间隔分组的数据点集合。批处理模式中使用的数据集通常符合下列特征:

  1. 有界:批处理数据集代表数据的有限集合
  2. 持久:数据通常始终存储在某种类型的持久存储位置中
  3. 大量:批处理操作通常是处理极为海量数据集的唯一方法

流处理:

流处理可以对随时进入系统的数据进行计算。流处理方式无需针对整个数据集执行操作,而是对通过系统传输的每个数据项执行操作。流处理中的数据集是“无边界”的,这就产生了几个重要的影响:

  1. 可以处理几乎无限量的数据,但同一时间只能处理一条数据,不同记录间只维持最少量的状态
  2. 处理工作是基于事件的,除非明确停止否则没有“尽头”
  3. 处理结果立刻可用,并会随着新数据的抵达继续更新。

2、电商用户行为分析

在这里插入图片描述

2.1、电商用户行为分析
  1. 热门统计
    点击、浏览
    热门商品、近期热门商品、分类热门商品,流量统计

  2. 偏好统计
    收藏、喜欢、评分、打标签
    用户画像,推荐列表(结合特征工程和机器学习算法)

  3. 风险控制
    下订单、支付、登录
    订单失效监控,恶意登录(短时间内频繁登录失败)监控

2.2、项目模块设计

分为:热门统计、风险控制

热门统计
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值