开发中召回集合的生成【笔记】

工具:

采用算法,CF,ALS,所用开发环境 spark-ml库

原始数据格式:

uin|mapid|TotalDuration      用户-地图-游戏时间

步骤:

  1. 处理原始数据,用相关用户行为定义算法,处理数据得到 uin|mapid|rating 对应用户-地图评分
  2. 根据评分数据计算地图相似度(ITEM_CF,邻域算法)
  3. 用户相似采用spark-ml自带的ALS算法,原始数据UinCount>>>>MapCount,数据量过于庞大集群受不了且成本太高

最终数据格式:

	地图相似:MapId|Arr[(MapId,score).....]|,地图相似关联表
	ALS:Uin|Arr[(MapId,score).....]|,用户推荐地图关联表

作用:

  1. 地图相似用于关联MapId,可在线上根据用户点击MapId,关联相关地图实时推送,也可根据用户上一次登录的游戏地图行为进行关联
    优点:较为精准,点对点,可用于线上关联MapId
    缺点:多样性差

  2. 用户推荐地图关联表,离线计算的推荐列表,用于线上关联uin
    优点:多样性高,点对面
    缺点:只能离线,线上无变化

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值