机器学习特征工程:特征缩放与无量纲化
在机器学习的特征工程中,特征缩放和无量纲化是非常重要的步骤之一。其中,数据标准化(StandardScaler)是一种常用的特征缩放方法,它可以将原始数据按照均值为0、标准差为1的方式进行缩放,从而使得不同特征之间的数值范围一致。
Python中的Scikit-learn库提供了现成的StandardScaler类,可以方便地实现数据标准化功能。下面我们来看一个简单的例子,展示如何使用StandardScaler对数据进行标准化:
import numpy as np
from sklearn.preprocessing import StandardScaler
# 生成随机数据
data = np.random.rand(100, 3)