课时1. 时间特征与空间特征
心得:在这一节里重新认识了“特征工程”的概念,明白了它的重要性,了解了很多自定义函数用于处理时间和空间数据。
机器学习的重中之重——特征工程
数据和特征决定了机器学习的上限,而模型和算法知识逼近这个上限。——数据与特征的重要性要大于模型和算法
1. 时间特征:离散时间、连续时间
2. 空间特征
3. 数值特征:归一化、标准化、正则化
4. 类别特征:序号编码、独热编码(one-hot)、二进制编码、标签编码
5. 统计及组合特征:统计特征、业务特征、组合特征
6. 特征变换:对数变换、指数变换、box-cox变换
特征工程是对原始数据进行一系列工程处理,将其提炼为特征,作为输入,供算法和模型使用。
宇宙:“宇”指无限空间,“宙”指无限时间。时间和空间是用来刻画世界极其重要的维度。