Deep Feature Synthesis: How Automated Feature Engineering Works
理解DFS的3个重要概念:
1、特征来源于数据集中数据之间的关系:
DFS专注于数据库多表数据或者日志文件的事物数据。
2、在数据集中,很多特征是通过使用类似的数学运算得出的:
举个例子,对用户的购买数据,需要预测用户的最大购买金额。我们将收集与用户相关的所有交易,并找出最大购买金额。同样的,我们也是这样做的对航班数据进行预测最长航班延误时间。
3、新的特征通常是利用原来的特征构建的