3 特征构造
学习目标
- 知道未来信息的概念,及处理未来信息的方法
- 掌握从原始数据构造出新特征的方法
- 掌握特征变换的方法
- 掌握缺失值处理的方法
1 数据准备
1.1 梳理数据的内在逻辑
关系种类
一对一:一个用户有一个注册手机号
一对多:一个用户多笔借款
多对多:一个用户可以登录多个设备,一个设备可以有多个用户登录
-
举例
下图中,蓝色框为二月当期账单,红色框为订单
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eG8LxzLu-1633954039582)(img/feature7.png)]
梳理类ER图
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mrumkXlK-1633954039591)(img/feature8.png)]
-
任务:分析厚数据常登陆首单用户的逾期情况
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-He2ldHG2-1633954039593)(img/feature9.png)]
- 可以将表结构展示到特征文档当中,说明取数逻辑
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-otyUvZXc-1633954039594)(img/feature10.png)]