1、sklearn自带数据集
sklearn中的算法一样,使用“实例化、fit、predict/score”三部曲。
datasets里面能够自己创建数据集、也提供可使用的数据集,二者在同一级
from sklearn import datasets
from sklearn.linear_ .model import LinearRegression
import matplotib.pyplot as plt
#laded_data = dasetsload. boston
##data_X = loaded_data.data
#data_y = loaded.data.target
#model = LinarReression()
#model.fit(data_X data_y)
#print(model.predict(data_X[:4, :])
##print(dat_ y[:4])
X,y = datasets.make. regresion(n_ samples-100, n featu
plt.scatter(X, y)
2、开源数据集
3、sklearn可以创建数据集
使用numpy来构建数据集的技术
回归数据创建函数arrayGenReg