(10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】

(1)工业界推荐系统-小红书推荐场景及内部实践【业务指标、链路、ItemCF】
(2)工业界推荐系统-小红书推荐场景及内部实践【UserCF、离线特征处理】
(3)工业界推荐系统-小红书推荐场景及内部实践【矩阵补充、双塔模型】
(4)工业界推荐系统-小红书推荐场景及内部实践【正负样本选择】
(5)工业界推荐系统-小红书推荐场景及内部实践【线上召回和模型更新】
(6)工业界推荐系统-小红书推荐场景及内部实践【其他召回通道】
(7)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题1】
(8)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题2】
(9)工业界推荐系统-小红书推荐场景及内部实践【排序模型】

推荐系统链路

在这里插入图片描述

用户画像

• 用户 ID(在召回、排序中做 embedding)。
• 人口统计学属性:性别、年龄。
• 账号信息:新老、活跃度…
• 感兴趣的类目、关键词、品牌。

物品画像

• 物品 ID(在召回、排序中做 embedding)。
• 发布时间(或者年龄)。
• GeoHash(经纬度编码)、所在城市。
• 标题、类目、关键词、品牌…
• 字数、图片数、视频清晰度、标签数…
• 内容信息量、图片美学…

用户统计特征

• 用户最近30天(7天、1天、1小时)的曝光数、点击数、 点赞数、收藏数…
• 按照笔记图文/视频分桶。(比如最近7天,该用户对图文笔记的点击率、对视频笔记的点击率。)
• 按照笔记类目分桶。(比如最近30天,用户对美妆笔记的点击率、对美食笔记的点击率、对科技数码笔记的点击率。)

笔记统计特征

  • 笔记最近30天(7天、1天、1小时)的曝光数、点击数、 点赞数、收藏数…
  • 按照用户性别分桶、按照用户年龄分桶…
  • 作者特征:
    • 发布笔记数
    • 粉丝数
    • 消费指标(曝光数、点击数、点赞数、收藏数)

场景特征

• 用户定位 GeoHash(经纬度编码)、城市。
• 当前时刻(分段,做 embedding)。
• 是否是周末、是否是节假日。
• 手机品牌、手机型号、操作系统。

特征处理

• 离散特征:做embedding。

  • 用户ID、笔记ID、作者ID。
  • 类目、关键词、城市、手机品牌。

• 连续特征:做分桶,变成离散特征。

  • 年龄、笔记字数、视频长度。

• 连续特征:其他变换。

  • 曝光数、点击数、点赞数等数值做 log 1 + 𝑥 。
  • 转化为点击率、点赞率等值,并做平滑。

数据服务链路

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

NLP_wendi

谢谢您的支持。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值