量纲思维
把数据变成同一个维度,归一化
特征工程
特征如何使用?
-业务理解,可用性评估特征如何获取?
-获取与存储
特征如何处理?
-清洗,标准化,特征选择,特征扩展更新特征?
数据清洗
1、比方说一些年龄特征是空值或者负数或者大于200等
2、某个页面的播放数据大于曝光数据,这些就是数据的不合理
量纲思维
把数据变成同一个维度,归一化
特征工程
特征如何使用?
-业务理解,可用性评估特征如何获取?
-获取与存储
特征如何处理?
-清洗,标准化,特征选择,特征扩展更新特征?
数据清洗
1、比方说一些年龄特征是空值或者负数或者大于200等
2、某个页面的播放数据大于曝光数据,这些就是数据的不合理