使用NumPy和Pandas制造临时性数据练习回归类模型
首先 这个不用介绍
import numpy as np
import pandas as pd
然后
np.random.seed( 9 ) #设置随机种子
a = np.random.randn( 5, 7 ) #生成你想要的形状的随机数据
a
注意 此时的数据类型是numpy.ndarray
下一步 把ndarray转换成了dataframe
a = pd.DataFrame( a )
a.head()
下一步 添加列名
a.columns = [ “x1”, “x2”, “x3”, “x4”, “x5”, “y1”, “y2” ]
a.head()
下一步 划分x和y
x = a.drop( [ ‘y1’, ‘y2’ ], axis = 1 )
x.head()
y = a.drop( [ ‘x1’, ‘x2’, ‘x3’, ‘x4’, ‘x5’ ], axis = 1 )
y.head()
至此 数据准备完成 你已经无中生有了一套数据
然后 以大名鼎鼎的PLSR为例
from sklearn.cross_decomposition import PLSRegression
plsr = PLSRegression( n_compo