首先给出特征工程的概述图,如下图。
然后接下来,会就其中的内容详细学习。
一,单个特征归一化
归一化就是指当每个特征的数值之间相差太大,无法很好的相互映射时,通过函数处理使其落在同一数量级的区间的方式。
归一化的方式通常有两种:
Standardization
Standardization又称为Z-score normalization,量化后的特征将服从标准正态分布:
μ和δ分别为对应特征的均值和标准差。量化后的特征将分布在[-1, 1]区间。
Min-Max Scaling
Min-Max Scaling又称为Min-Max normalization, 特征量化的公式为:
它对原始数据进行线性变换,使结果映射到[0,1]的范围,实现对原始数据的等比缩放。如果要将数据限制到[-1,1],则:
深度学习基础——特征工程(一)
最新推荐文章于 2024-04-29 19:50:48 发布