特征交叉

less97

于 2021-04-26 15:10:13 发布

阅读量2.1k

点赞数

文章标签：特征交叉 CTR 用户偏好组合特征业务理解

原文链接：https://mp.weixin.qq.com/s?__biz=MzI2MDU3OTgyOQ==&mid=2247488595&idx=1&sn=c6e743b0e58cc8fea7634d195fe5e846&scene=21#wechat_redirect

版权

本文探讨了如何通过特征交叉技术在CTR场景中增强模型表现，涉及用户类别偏好、年龄特征、时间行为和价格匹配等实例，强调业务理解在特征工程中的关键作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

组合特征也叫特征交叉（Feature Crosses），即不同类型或者不同维度特征之间的交叉组合，其主要目的是为了弥补CTR场景中早期的模型无法有效的进行特征组合而产生的想法和实践，随着算法模型的进步，虽然一些机器学习排序模型（GBDT+LR、FM等）和深度学习排序模型能够捕获特征之间的联系，但是前期仍然会生成一些组合特征，比如用户在某些类别下的行为统计，性别下的数据统计等。

日常工作场景中的特征往往都是以用户和其对应的属性作为出发点，然后和物品对应的属性特征或者上下文特征进行交叉组合，比如：

用户与类别特征组合（eg：电商平台中，用户在不同类别下的点击次数，可以简单衡量用户的类别偏好）
用户不同年龄档与类别特征组合（eg：新闻平台中，少年用户在娱乐新闻下的点击次数会比较高，青年用户在社会新闻下的点击次数会比较高）
用户身份与时间特征组合（eg：学生周六周日、节假日，在某娱乐APP内的行为会比较丰富，上班族早晚高峰，在某娱乐APP内的行为会比较丰富）
用户的价格偏好与物品的价格级别特征组合（eg：用户A偏好的价格级别为中，物品的价格级别为高，那么组合特征就是0，即两者不匹配）

这里只是举几个具体的例子，在实际的场景中，往往会结合数据分析去挖掘潜在的价值特征组合。这时候便会借助数据分析、数据挖掘、分析者的敏感直觉和对业务的深入理解去进行挖掘。笔者之前有幸听到一个分享，大概意思就是说不同人群对于APP推送消息的处理风格和处理时间很不一样，比如有的人会直接划掉，有的人则会在某个时间段进行消息查看，这时候便可以考虑对用户Push消息提供个性化时间分发，从而提高用户的打开率。

类似的场景还有很多，比如安装某些APP的用户偏好内容不一致，手机机型不同的用户阅读的咨询内容风格也会有差别等，所以说做算法、做数据、做分析，脱离了业务理解都是耍流氓！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。