场景描述
随着内容进一步发展,我们不得不面对组合特征或高维特征的问题。需要一种有效的方法帮助找到应该对哪些特征进行组合。
知识点:组合特征
问题:怎样有效地找到组合特征?
分析与解答
这里介绍基于决策树的特征组合寻找方法
。以点击预测问题为例,假设原始输入特征包含年龄、性别、用户类型(试用期、付费)、物品类型(护肤、食品等)4个方面的信息,并且根据原始输入和标签(点击/未点击)构造出了决策树,如图1.2所示
于是,每一条从根节点到叶节点的路径都可以看成一种特征组合方式。具体来说,就有以下4种特征组合的方式:
( 1 ) “年龄<=35” 且 “性别=女” 。
( 2 ) “年龄<=35 ” 且 “物品类别=护肤” 。
( 3 ) “用户类型=付费” 且“物品类型=