【王喆-推荐系统】(task1)推荐系统的五大特征(特征工程篇)

本文介绍了推荐系统中的特征工程,包括特征工程的意义、原则和常用特征。内容涵盖用户画像、物品画像、用户行为数据、用户关系数据、属性标签类数据、内容类数据以及场景信息。并探讨了音乐APP中可能影响推荐的特征。此外,还讨论了业界在特征存储、缺失值处理、用户行为数据使用等方面的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习心得

  • 本次task学习特征的选择,推荐系统中可用的特征非常多,但它们基本上可被划分到“用户行为”、“用户关系”、“属性标签”、“内容数据”、“场景信息”这五个类别,而且挑选特征的方法也遵循着“保留有用信息,摒弃冗余信息”的原则。
  • 针对不同的推荐系统,要针对它们的业务特点,因地制宜地挑选合适的特征,抓住业务场景中的关键信息,这也是在工作中要积累的经验。从工程的角度来说,除了特征的挑选,特征工程还包括大量的数据预处理、特征转换、特征筛选等工作。
  • 离散特征:维度不高就onehot,维度过高就做embedding。
    • 用户ID、笔记ID、作者ID。
    • 类目、关键词、城市、手机品牌。
  • 连续特征:做分桶,变成离散特征。
    • 年龄、笔记字数、视频长度。
  • 连续特征:其他变换。
    • 曝光数、点击数、点赞数等数值做 log 1 + 𝑥 。
    • 转化为点击率、点赞率等值,并做平滑。

一、特征工程是啥

推荐系统就是利用“用户信息”“物品信息”“场景信息”这三大部分有价值数据,通过构建推荐模型得出推荐列表的工程系统。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

山顶夕景

小哥哥给我买个零食可好

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值