什么是机器学习?
百度百科上说:“机器程序从经验E中学习解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验而提高。”
我自己认为机器学习就是让机器用现有的数据和算法,得出参数。从而得到可以直接使用的模型。
机器学习一般可以分为两类:有监督学习和无监督学习。
那什么是线性回归呢?
线性回归是一种x和y之间的关系为线性关系的回归分析,而回归分析就是一种因变量为连续值得监督学习。
用数据拟合一条直接是线性数据回归模拟最简单的形式了。所以要从最简单的一元线性回归开始学习。
问题
用所学知识用下面数据获得最佳拟合直线(如下图)
//数据来源
%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
import numpy as np
rng = np.random.RandomState(1)
x = 10 * rng.rand(50)
y = 2 * x - 5 + rng.randn(50)
plt.scatter(x,y)
一、拟合数据
可以用Scikit-Learn的LinearRegression评估器来拟合数据, 并获得最佳拟合直线。
二、使用步骤
1.引入库
代码如下:
from sklearn.linear_model import LinearRegression
#线性回归,导入scikit-learn包
2.创建模拟
代码如下:
model = LinearRegression(fit_intercept=True)
#创建一个类的实例LinearRegression,它将代表回归模型。fit_intercept参数为True代表计算截距
3.创建测试数据
代码如下:
model.fit(x[:,np.newaxis],y)
#model.fit()中x,y和模拟定义时的inputs,outputs形状一致
#np.newaxis->插入新维度,假如x是一个(5,)的数组,x[:,np.newaxis]->就变为(5,1)的二维数组
xfit = np.linspace(0,10,1000)
#即,将0-10分成1000份
yfit = model.predict(xfit[:,np.newaxis])
#model.predict输入测试数据,预测结果
4.生成最佳拟合直线
代码如下:
plt.scatter(x,y)
#生成一个散点图
plt.plot(xfit,yfit);
#生成拟合直线
图片如下:
5.检查拟合效果
代码如下:
print(model.coef_[0])
#查看拟合直线的斜率
print(model.intercept_)
#查看拟合直线的截距
结果如下:
拟合结果与真实值非常接近
总结
以上就是拟合一条线性直线的讲解(如果对你理解线性回归确实有帮助的话,帮忙点个赞,同时也欢迎指出问题)