1 用户行为分析

本文介绍了用户行为分析的重要性,包括分析用户来源、识别用户行为数据的价值,并探讨了系统架构、数据采集和处理流程。重点讲述了Nginx的配置,包括负载均衡、UserID模块、日志输出格式等,以及购物车服务的搭建和数据准备。
摘要由CSDN通过智能技术生成

常见问题

  • 项目会涉及到哪些技术?
    • Nginx
    • HDFS
    • Flume
    • MapReduce
    • Scala
    • Spark
    • 可视化展示
  • 需要会哪些编程语言?
    • 具备Java基本知识
    • 具备Html基本知识
    • Scala?会Step by Step讲解
  • 需要提前做哪些准备?
    • 准备Linux运行环境
    • 搭建CDH集群

项目背景

  • 用户行为分析需要分析哪些内容?
    在这里插入图片描述

你是谁?

在这里插入图片描述
在这里插入图片描述

你从哪里来

  • 免费流量
    • 直接打开网页
    • 好友推荐
      • 微信/微博/QQ
    • 友情链接
    • 搜索引擎自然流量
  • 付费流量
    • 上网导航
    • 广告直通车
    • 搜索引擎SEM
  • 为何要分析用户来源?
    • 不同流量质量存在差异!

你要到哪里去?

  • 在浏览的过程中会留下各种行为数据!
    在这里插入图片描述
  • 终极目标:促使用户形成转化效果
  • 购物类:淘宝、京东、小红书、拼多多
    • 促进购买
  • 理财类:陆金所、蚂蚁财富
    • 促进投资
  • 新闻类:今日头条
    • 提升阅读量
  • 视频类:爱奇艺、腾讯视频
    • 提升观看量
    • 购买会员

行为数据价值

  • 作为评价指标
  1. 哪个页面访问人数最多
  2. 哪个商品最有价值
  • 构建画像
  1. 用户属性画像
  2. 用户行为画像
  • 促进转化率
  1. 构建渠道分析模型
  2. 构建广告点击模型
  3. 构建商品推荐模型
  • 风险控制
  1. 识别羊毛党
  2. 团伙欺诈

行为分析指标

数据指标

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

数据搜集

  • 需要搜集哪些行为数据?
    • 网页访问日志
    • 业务行为
      • 收藏
      • 评论
      • 添加购物车
      • 下单
      • 支付
    • 点击行为
      • 鼠标悬停
      • 按钮/图片点击

数据搜集面临的挑战

  • 所有的访问行为均以日志的形式记录
    • 日志文件离散存储
    • 日志文件非结构化
    • 记录数量巨大:TB级每日
  • 数据孤岛
    • 文件
      • 访问日志
      • 行为日志
    • 数据库:MySQL/Oracle
      • 业务数据

系统架构

工作流程

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值