增维也叫特征扩展
-
处理目的:
解决模型欠拟合
捕捉自变量与应变量之间的非线性关系 -
常见处理方法
多项式拓展:
1)假设数据集中包含自变量a、b2)如果对自变量做二项式扩展
3)自变量集从两个变量扩展为5个变量(a、b、a×a、b×b、a×b)
from sklearn.preprocessing import PolynomialFeatures # 准备筛选数据 x = df[['complete_year','area', 'daypop', 'sub_kde'