实验代码转载自:http://lib.csdn.net/article/machinelearning/34918
import matplotlib.pyplot as plt#matplotlib是python上的一个2D绘图库
import numpy as np#提供数值运算的程序库
from sklearn import datasets, linear_model#sklearn是基于numpy和scipy的一个机器学习算法库
#sklearn 安装前需要对numpy与scipy进行安装
diabetes = datasets.load_diabetes()#diabetes 是一个关于糖尿病的数据集, 该数据集包括442个病人的生理数据及一年以后的病情发展情况。
diabetes_X = diabetes.data[:,np.newaxis,2]#numpy中包含的newaxis可以给原数组增加一个维度,这里用来说明使用一个特征
diabetes_X_train = diabetes_X[:-20]#序列的切片操作,取序列第一项到倒数第21项的数据(切片左闭右开)diabetes_X_test = diabetes_X[-20:]
diabetes_y_train = diabetes.target[:-20]
diabetes_y_test = diabetes.target[-20:]
regr = linear_model.LinearRegression()
regr.fit(diabetes_X_train, diabetes_y_train) #这里就是在训练模型了
print('Coefficients: \n', regr.coef_) #这就是w0,常数项
print("Residual sum of squares: %.2f" % np.mean((regr.predict(diabetes_X_test) - diabetes_y_test) ** 2)) #这个是预测与真实的差
print('Variance score: %.2f' % regr.score(diabetes_X_test, diabetes_y_test)) #这里就是得分,1为拟合最好,0最差
plt.scatter(diabetes_X_test, diabetes_y_test, color = 'black')#描点
plt.plot(diabetes_X_test,regr.predict(diabetes_X_test), color='blue',linewidth=3)#画线
plt.xticks(())#设置x轴文本为空
plt.yticks(())#设置y轴文本为空
plt.show()