目录
备注:本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记,感兴趣的同学可以购买本书学习
1、线性模型基本原理
1.1 线性模型一般公式
线性模型在拟合数据集时,会让自己距离每个数据点的加和为最小值,即找到找到训练数据集中y的预测值和真实值的平方差的最小值,这也是线性回归模型的基本原理,线性回归也称为最小二乘法。
使用线性模型的前提条件,是假设目标y是数据特征的线性组合。
1.2 线性模型图形表示
##1-数据准备
#导入sklearn.datasets的make_regression数据集
from sklearn.datasets import make_regression
X, y = make_regression(n_samples=50, n_features=1, n_informative=1,
noise=50,random_state=1)
##2-数据建模
#导入算法包
from sklearn.linear_model import LinearRegression
#使用算法
reg = LinearRegression()
#模型训练
reg.fit(X,y)
#绘制拟合图
%matplotlib inline
import matplotlib.pyplot as plt
plt.scatter(X,y,c='b',s=60)
##3-模型应用
#导入待预测数据
import numpy as np
z = np.linspace(-3,3,200).reshape(-1,1)
plt.plot(z, reg.predict(z),c='k')
plt.title('Linear Regression')
#打印线性方程
print('直线的斜率是:{:.2f}'.format(reg.coef_[0]))
print('直线的截距是:{:.2f}'.format(reg.intercept_))