机器学习—02线性回归

最新推荐文章于 2022-04-26 19:05:05 发布

小黑--

最新推荐文章于 2022-04-26 19:05:05 发布

阅读量504

点赞数 1

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/qq_41645466/article/details/104091220

版权

本文介绍了机器学习中的线性回归，从单变量线性回归出发，详细讲解了损失函数—均方误差，以及梯度下降算法的不同形式，包括批梯度下降、随机梯度下降和Mini-Batch梯度下降，并讨论了学习率衰减和多变量线性回归的应用。

摘要由CSDN通过智能技术生成

文章目录

一、单变量线性回归
二、损失（代价）函数——均方误差
- 1、损失函数J(θ~0~，θ~1~)
- 3、损失函数的等高图
三、梯度下降
四、三种梯度下降
五、多变量线性回归
- 1、多变量线性回归模型
- 2、多元梯度下降

一、单变量线性回归

最简单的开始：线性方程
在这里插入图片描述
简单来说:
线性：穿过很多点的直线，利用这个算法生成的模型一定是一条直线
回归：求解方程的步骤，让数据回归（聚集）到一个特定的模型中，如果特定的模型指的是线性，那么就是让所有点都靠近这条线

线性回归实例:

房屋面积（x）	房屋总价（y）
40	78
96	200
135	330
…	…

在这里插入图片描述

m：训练集数据的总量
x：输入变量
y：输出变量，也叫做标签
(x,y)：一个训练样本
( x_i , y_i )：第i个训练样本

属于有监督的学习：可以预测到一个确定的结果

我们知道机器学习的基本步骤是：
在这里插入图片描述
对于一元线性回归（单变量线性回归）来说，学习算法的模型公式为: y = ax + b
（a：斜率 b：截距）
我们换一种写法：h_θ(x) = θ₀ + θ₁x₁
线性回归实际上要做的事是：选择合适的参数（θ₀，θ₁），使得模型h_θ(x)能很好的拟合我们的数据

在这里插入图片描述
如图，图3才是最接近训练集的拟合，因此也就是要求出这条直线的系数θ₀，θ₁

用法：

导包：
from sklearn.linear_model import LinearRegression
导数据：把数据x 和y 准备好
建模：
实例化一个线性回归类
lin_reg = LinearRegression()
通过fit()方法训练模型得到h_θ(x)
lin_reg.fit(x,y)
建模完成后，模型的参数就已经存到了lin_reg里，可以通过 lin_reg.intercept_ 和 lin_reg.coef_ 查看系数
进行预测
把需要做预测的输入数据x_predict准备好，进行预测
lin_reg.predict(x_predict)

练习:利用Sklearn做线性回归的预测

import numpy as np
from sklearn.linear_model import LinearRegression

#准备好数据 x ,y
X = 2 * np.random.rand(100, 1) #生成100行1列的0~2的均匀分布的数
y = 4 + 3 * X + np.random.randn(100, 1) # 加了误差，100行1列，服从正态分布

lin_reg = LinearRegression() # 实例化对象

# 训练模型：fit()方法
lin_reg.fit(X, y)

# intercept 是截距 coef是参数
print(lin_reg.intercept_, lin_reg.coef_)

# 预测
X_new = np.array([[0], [2]]) #x的值必须是2维数组
print(lin_reg.predict(X_new))

运行结果：
在这里插入图片描述

"""
[3, 5, 7, 9, 11, 13, 15, 17, 19, 21, ?]
求第11个数
"""

import numpy as np
from sklearn.linear_model import LinearRegression

x = np.array([1,2,3,4,5,6,7,8,9,10]).reshape(-1,1) # x是二维数组
y = np.array([3,5,7,9,11,13,15,17,19,21])

lin_reg = LinearRegression()      # 实例化对象 
lin_reg.fit(x,y)                  # 进行学习
print(lin_reg.predict([[11]]))    # 预测第11个值，二维数组
print(lin_reg.intercept_, lin_reg.coef_) # 斜率和截距

运行结果:
在这里插入图片描述
numpy模块:用来存储和处理大型矩阵，用于数组计算

import numpy as np

#创建一维数组:
arr

最低0.47元/天解锁文章

小黑--

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习—02线性回归

文章目录一、单变量线性回归二、损失（代价）函数——均方误差1、损失函数J(θ~0~，θ~1~)3、损失函数的等高图三、梯度下降1、梯度下降思想2、梯度下降算法3、线性回归的梯度下降四、三种梯度下降1、批梯度下降2、随机梯度下降一、单变量线性回归最简单的开始：线性方程简单来说:线性：穿过很多点的直线，利用这个算法生成的模型一定是一条直线回归：求解方程的步骤，让数据回归（聚集）到一个特定的...
复制链接

扫一扫

专栏目录