sklearn-例程–Plotting Cross-Validated Predictions
对于sklearn我也是第一次接触到而已,机器学习的算法也只是大概的听过一些名词。这次写博客学习的目的有如下几个:
- 学习sklearn的使用方式,各种函数的意义和应用场合。
- 了解机器学习的具体算法,以及不同的算法用于什么场合。
- 似乎还有一个模型的概念,我所不清楚的,那么最后一个就是在不断的学习过程中,了解这些还不清楚的东西
现在开始我们的第一个例程的学习。
代码如下
from sklearn import datasets
from sklearn.model_selection import cross_val_predict
from sklearn import linear_model
import matplotlib.pyplot as plt
lr = linear_model.LinearRegression()
boston = datasets.load_boston()
y = boston.target
predicted = cross_val_predict(lr,boston.data,y,cv=10)
fig,ax = plt.subplots()
ax.scatter(y,predicted)
ax.plot([y.min(),y.max()],[y.min(),y.max()],'k--',lw=4)
ax.set_xlabel('measured')
ax.set_ylabel('predicted')
plt.show()
代码梳理
- import :用于导入其他模块代码
- as:别名,有时候模块名太长,可以在导入的时候,使用as指定一个别名
- lr = linear_model.LinearRegression():线性回归算法。见
- cross_val_predict:
plt.subplots:
具体分析
LinearRegression,线性回归算法。
假设目标值和参数之间存在线性关系,即