原理:将数据从原来的坐标系转换到新的坐标系。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标系选择和第一个坐标轴正交且具有最大方差的方向。该过程一直重复,重复次数为原始数据中特征的数目。目的是降维且增加特征向量的数目,找到主要线性分量及其表征方式。
例子及代码:
【实验步骤】
1、导入数据并切片:
import pandas as pd
Data=pd.read_excel('农村居民人均可支配收入来源2016.xlsx')
X=Data.iloc[:,1:]
2、标准化处理;
from sklearn.preprocessing import StandardScaler
scaler=StandardScaler()