Featuretools 学习3 - 深度特征合成

深度特征合成

深度特征合成(Deep Feature Synthesis, DFS)是一种用于对关系和时间数据执行特征工程的自动化方法。

输入数据

DFS需要结构化的数据集才能执行特征工程。以下演示使用的是模拟客户交易数据集。
在这里插入图片描述

运行DFS

通常,没有自动化特征工程的情况下,数据科学家会编写代码以汇总客户的数据,并应用不同的统计功能,从而产生量化客户行为的功能。在此示例中,专家可能对一下特征感兴趣:sessions的总数/customer注册的月份。
将target_entity指定为customer并且将“count”和“month”指定为原语primitives时,DFS可以生成这些功能。
在这里插入图片描述
上例中,“count”是一个聚合原语(aggregation primitive),因为它基于与一个customer相关的许多sessions来计算单个值。“month”是一个转换原语(transform primitive),因为它将一个customer的一个值转换为另一个。

创建“深度特征”

DFS的名称源于该算法能够堆叠原语以生成更复杂特征的能力。每次堆叠原语时,都会增加特征的“深度”。max_depth参数控制DFS返回功能的最大深度。
在这里插入图片描述
选择其中一个深度为2的生成特征了解一下:
在这里插入图片描述
该特征为每一个customer:(1)计算每个session的所有交易金额,得到每个session的总金额;(2)然后将均值应用于多个sessions的总金额,以确定每个session花费的平均金额。
举例:为每个customer计算他们开始session时 最常见的时间
在这里插入图片描述

改变目标实体

DFE功能强大,可以为数据集中任何实体创建特征矩阵。将目标实体切换为session,那么可以为每个session综合功能。
在这里插入图片描述
上例中,DFS也可以对父实体构建深度特征。比如:计算session的customer的平均交易额。
在这里插入图片描述
参考官方链接:Deep Feature Synthesis

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值