推荐系统:电商推荐系统架构

一、数据

1、数据生命周期

在这里插入图片描述

2、数据源解析

2.1 商品信息

在这里插入图片描述

2.2 用户评分数据

在这里插入图片描述

2.3 主要数据模型

在这里插入图片描述

3、大数据处理流程

3.1 大数据离线处理流程

在这里插入图片描述

3.2 大数据实时处理流程

在这里插入图片描述

二、大数据推荐项目系统架构

在这里插入图片描述

1、项目系统架构

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1、离线统计模块

在这里插入图片描述

1.1 历史热门商品统计

  • 统计所有历史数据中每个商品的评分数,得:RateMoreProducts 数据结构:productId,count
    select productId, count(productId) as count from ratings group by productId order by count desc
    

1.2 近期热门商品统计

  • 统计每月的商品评分个数,就代表了商品近期的热门度,得:ratingOfMonth、RateMoreRecentlyProducts
    select productId, score, changeDate(timestamp) as yearmonth from ratings
    
    select productId, count(productId) as count ,yearmonth from ratingOfMonth group by yearmonth, productId order by yearmonth desc,count desc
    
    changDate :UDF函数,使用 SimpleDateFormat 对 Date 进行格式转化,转化格式为“yyyyMM”
    RateMoreRecentlyProducts 数据结构:productId,count,yearmonth

1.3 商品平均评分统计

  • AverageProducts 数据结构:productId,avg
    select productId, avg(score) 
  • 1
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值