sklearn 的数据在:
http://scikit-learn.org/stable/datasets/ (里面有很多数据)
load.什么都是已经有的数据。可以直接用
sklearn还有有个强大的功能,可以生成数据
回归的生成例子:
sklearn.datasets.
make
_regression
(n_samples=100, n_features=100, n_informative=10, n_targets=1, bias=0.0,effective_rank=None, tail_strength=0.5, noise=0.0, shuffle=True, coef=False, random_state=None)
from sklearn import datasets
from sklearn.linear_model import LinearRegression
loaded_data=datasets.load_boston()#下载博士屯的房价
data_X=loaded_data.data#数据的属性
data_y=loaded_data.target#数据的标签
model=LinearRegression()#模型
model.fit(data_X,data_y)#训练参数
print(model.predict(data_X[:4,:]))#预测前四个数据的标签
print(data_y[:4])
和上一章的差不多是不是,其实是一样的,只是数据变了一下
怎么创造一些数据:
from sklearn import datasets
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt #图形化的工具模块
X,y=datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=1)
#一个一个解释n_samples=100就是有一百个例子,n_features=1属性有一个,
#n_targets=1标签有一个,噪音为1;
plt.scatter(X,y)#散点的形式输出在图上
plt.show()
展示一下