ROS与机器学习(二)——线性回归

ROS与机器学习(二)——线性回归


机器学习的一种基础算法——线性回归

1、理论基础

线性回归属于机器学习中的监督学习,即先给定一个标记过的数据集,根据这个数据集学习出一个线性函数,然后测试训练出的函数是否满足需求,即此函数是否足够拟合数据集中的数据,再根据代价函数挑选出最好的函数即可。

1.1 线性回归模型

线性回归模型有很多种,此处以单变量线性回归模型为例,因为是线性回归,所以使用的函数为线性函数;因为是单变量,所以只有一个x变量。
单变量线性函数回归模型的公式如下:
在这里插入图片描述

其中x代表特征(feature),h(x)代表假设(hypothesis)。

1.2 代价函数

为评价线性函数拟合的优劣,需要引入一个评价拟合程度的指标——代价函数。代价函数的值越小,说明线性回归性越好,也就是模型和数据集的拟合程度越好,若值为0,则表示完全拟合。
代价函数的模型也通过数学公式表示,如下:
在这里插入图片描述
在这里插入图片描述

1.3 梯度下降

给定一个拟合函数,虽然能够根据代价函数知道这个函数拟合的优劣,但是函数这么多,就需要引出梯度下降算法,它能够找出代价函数的最小值。
梯度下降算法原理可以简单理解为:将函数比成一座山,我们站在某个山坡上往四周看,从哪个方向向下走一步能够下降得最快。

  • 先确定向下走一步的步伐大小,称为Learning Rate,也就是学习速率。
  • 给定任意初始值。
  • 确定一个向下的方向,向下走预定的步伐,并更新。
  • 当下降的高度小于某个定义的阈值时,则停止下降。
    如图所示就形象地描绘了梯度下降的过程。从图中可以看出:初始点不同,获得的最小值也不同。因此,梯度下降求得的只是局部最小值。
    在这里插入图片描述
    值得注意的是:下降的步伐大小非常重要,如果太小,则找到函数最小值的速度很慢;如果太大,则可能会出现Overshoot the Minimum现象。如果在Learning Rate取值后发现代价函数值增加,则需要减少Learning Rate。
    总之,梯度下降能够求出代价函数的最小值,从而求得线性回归函数的模型。

2、创建数据集

数据集是线性回归模型的基础,在使用TensorFlow进行机器学习之前,需要创建一个数据集。当然可以上网下载已有线性回归问题的数据集,例如某小区房价和房屋面积的关系、机票价格和时间的关系等。以下采用一种简单的方式创建一个随机数据集,使之满足线性回归问题的条件。
使用Python中的numpy库创建一组有一定规律的数据集。
在这里插入图片描述
在以上代码中,首先使用linspace创建了101个等差排列的x值;然后通过线性关系计算出对应于每个点的y值,再加入小范围的随机噪声;最后利用matplotlib工具将所有点绘制出来,如图所示。
在这里插入图片描述
以上代码中的[trX,trY]就是创建好的数据集,通过可视化显示,可以看出这些点的线性回归模型大约是trY=2*trX+4,因为采用这样一条直线就可以较好地拟合所有点。接下来尝试使用TensorFlow、利用机器学习的方式,将这条线性回归的直线模型训练出来。

3、使用TensorFlow解决线性回归问题

利用机器学习训练以上数据集线性回归模型的方法。
在这里插入图片描述
在这里插入图片描述
整体来看,首先需要创建数据集。
在这里插入图片描述
然后设计线性回归模型。tf.Variable()可以在计算图中创建一个节点,节点类型是一个变量;y_model就是我们设计的单变量线性回归模型。一个Variable代表一个可修改的张量,保存在TensorFlow用于描述交互性操作的图中。
在这里插入图片描述
之后创建模型的评价指标,也就是代价函数。tf_square()用来计算平方值。
在这里插入图片描述
在理论部分介绍了梯度下降算法,TensorFlow中提供了梯度下降算法的优化器,可以直接使用tf.train.GradientDescentOptimizer(learning_rate)方法调用。其中learning_rate代表学习速率,也就是训练过程中的步长参数。优化器的训练目的是使代价函数cost最小,使用minimize()设置。

sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)

切记使用tf.Session()创建会话。此外,由于在之前的代码中设置了变量,所以需要调用tf.global_variables_initializer()初始化所有变量节点。
在这里插入图片描述
现在就可以开始训练模型了,在这里我们进行100次训练,每次训练针对数据集(trX,trY)使用梯度下降求解最优模型系数。

print("Result : trY=" + str(w_) + "*trX + " + str(b_))

最后把训练得到的线性回归模型打印出来。
使用如下命令运行以上代码,可以查看机器学习得到的线性回归模型是否理想:

python linear_regression.py

输出结果如图所示。每次运行的结果可能都不相同,这是因为数据集中的数据在一定范围内随机产生,所以每次运行产生的数据集并不一致,但是最终训练出来的线性回归模型与我们预想一致。
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我不是“耀”神

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值