机器学习之预测回归一:简单线性回归

机器学习之预测回归一:简单线性回归

回归的目的是预测数值型的目标值。

本文介绍单变量线性回归和多变量线性回归的算法原理,然后给出 Python 实战案例。关于回归进一步的问题(局部加权回归和惩罚线性回归)可以参考另一篇文章: 预测回归二:局部加权回归和惩罚线性回归

1、单变量线性回归

假设自变量 x 与因变量 y 之间是线性函数的关系,可以假设线性函数为:
在这里插入图片描述
回归系数为:
在这里插入图片描述
以平方误差计算代价函数:
在这里插入图片描述
其中,x,y 是输入数据(训练集),h 是y的预测值。此代价函数也被称为平方误差函数 ( square error function ),或平方误差代价函数 ( square error cost function )。误差平方对于大多数问题,尤其是回归问题都是合理的选择。平方误差函数是解决回归问题最常用的方式。

求解回问题转化为优化问题,优化目标是使代价函数(或称为损失函数)最小:
在这里插入图片描述
采用梯度下降算法求解优化问题。梯度下降背后的思想是:开始时我们随机选择一个参数的组合,计算代价
函数,然后我们寻找下一个能让代价函数值下降最多的参数组合。我们持续这么做直到到到
一个局部最小值( local minimum) , 因为我们并没有尝试完所有的参数组合,所以不能确定
我们得到的局部最小值是否便是全局最小值( global minimum),选择不同的初始参数组合,
可能会找到不同的局部最小值。下图是梯度下降的直观示意图:
在这里插入图片描述
参数的计算公式可以写为:
在这里插入图片描述
其中 α 是学习率( learning rate),是决定收敛速度的超参数。

求解上面的方程关键在于求偏导:
在这里插入图片描述
求导后得到;
在这里插入图片描述
以上公式就是梯度下降算法求单变量解线性回归的递归公式。

2、多变量线性回归

多变量线性回归的推导过程同单变量线性回归一样,最后得到梯度下降的递归公式:

在这里插入图片描述

3、多项式回归

可以通过变量变换转化为多变量线性回归。如:

在这里插入图片描述

4、正规方程

求解线性回归还有另一种方法,它可以在不需要多步梯度下降的情况下,也能解出代价函数 J 的最小值,这是另一种称为正规方程(normal equations)的方法。

设有 n 个特征,有 m 个样本。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

则可以直接通过正规方程计算参数:

在这里插入图片描述

推导过程:

在这里插入图片描述

5、Python 代码实现

测试数据集使用

  • 4
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
很高兴回答您的问题!本文将重点介绍如何使用tensorflow和sklearn实现线性回归,并比较两种方法的优缺点。 一、线性回归介绍 线性回归是一种基本的机器学习算法,用于预测一个连续的数值。它是一种监督学习算法,需要有一个训练集来训练模型。在线性回归中,我们假设目标变量与自变量之间是线性关系,因此我们尝试找到一条最佳拟合直线来描述它们之间的关系。 二、使用tensorflow实现线性回归 TensorFlow是一个由Google开发的开源机器学习框架,它具有高效、灵活和易于使用的特点,广泛应用于各个领域。下面我们将介绍如何使用TensorFlow实现线性回归。 1、导入库 ``` import tensorflow as tf import numpy as np import matplotlib.pyplot as plt ``` 2、生成数据 为了演示线性回归,我们需要生成一些数据。我们将生成一个简单的数据集,其中有100个随机数,分别作为X和Y。 ``` X = np.random.rand(100).astype(np.float32) Y = X * 0.1 + 0.3 ``` 3、定义模型 在TensorFlow中,我们需要定义一个计算来描述我们的模型。在本例中,我们将使用一个简单的线性模型 y = wx + b,其中w和b是我们需要学习的参数。 ``` w = tf.Variable(tf.random_uniform([1], -1.0, 1.0)) b = tf.Variable(tf.zeros([1])) y = w * X + b ``` 4、定义损失函数 我们需要定义一个损失函数来衡量模型的性能。在本例中,我们将使用均方误差作为损失函数。 ``` loss = tf.reduce_mean(tf.square(y - Y)) ``` 5、定义优化器 我们需要定义一个优化器来最小化损失函数。在本例中,我们将使用梯度下降优化器。 ``` optimizer = tf.train.GradientDescentOptimizer(0.5) train = optimizer.minimize(loss) ``` 6、训练模型 我们需要训练模型来学习参数w和b。在本例中,我们将使用1000次迭代来训练模型。 ``` init = tf.global_variables_initializer() sess = tf.Session() sess.run(init) for step in range(1000): sess.run(train) if step % 100 == 0: print(step, sess.run(w), sess.run(b)) ``` 7、可视化结果 我们可以使用matplotlib库来可视化模型的结果。 ``` plt.plot(X, Y, 'ro', label='Original data') plt.plot(X, sess.run(w) * X + sess.run(b), label='Fitted line') plt.legend() plt.show() ``` 三、使用sklearn实现线性回归 scikit-learn是一个流行的Python机器学习库,提供了许多常用的算法和工具。现在我们将介绍如何使用scikit-learn实现线性回归。 1、导入库 ``` import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression ``` 2、生成数据 我们使用与上面相同的数据集。 ``` X = np.random.rand(100, 1) Y = X * 0.1 + 0.3 ``` 3、定义模型 在scikit-learn中,我们需要实例化一个线性回归模型。 ``` model = LinearRegression() ``` 4、训练模型 我们可以使用fit()方法来训练模型。 ``` model.fit(X, Y) ``` 5、可视化结果 我们可以使用matplotlib库来可视化模型的结果。 ``` plt.plot(X, Y, 'ro', label='Original data') plt.plot(X, model.predict(X), label='Fitted line') plt.legend() plt.show() ``` 四、对比两种方法的优缺点 使用TensorFlow实现线性回归的优点: 1. TensorFlow是一个灵活的框架,可以轻松地实现各种机器学习算法。 2. TensorFlow提供了高效的计算实现,可以利用GPU进行加速。 3. TensorFlow具有良好的可视化工具,可以帮助我们更好地理解和调试模型。 使用TensorFlow实现线性回归的缺点: 1. TensorFlow需要对TensorFlow的基本原理有一定的了解,对初学者来说可能有一定的难度。 2. TensorFlow的语法相对较为复杂,需要花费一些时间来学习和理解。 3. TensorFlow需要编写大量的代码来实现模型,相对于scikit-learn可能稍微繁琐一些。 使用scikit-learn实现线性回归的优点: 1. scikit-learn是一个简单易用的Python机器学习库,可以快速实现各种机器学习算法。 2. scikit-learn提供了大量的实用工具和函数,可以帮助我们更好地处理数据和调试模型。 3. scikit-learn的语法相对较为简单,对初学者来说比较友好。 使用scikit-learn实现线性回归的缺点: 1. scikit-learn的灵活性相对较低,不如TensorFlow那么灵活。 2. scikit-learn的计算效率可能比TensorFlow略低。 3. scikit-learn的可视化工具相对较少,不如TensorFlow那么强大。 以上就是使用TensorFlow和scikit-learn实现线性回归的方法和比较。希望对您有所帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值