ML course_week2

wenxingxingxing

已于 2022-07-28 15:39:31 修改

阅读量205

点赞数

分类专栏： Machine Learning 文章标签：机器学习 python 算法

于 2022-07-28 14:22:45 首次发布

本文链接：https://blog.csdn.net/wenxingxingxing/article/details/126033739

版权

Machine Learning 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

week2

四、多变量线性回归(Linear Regression with Multiple Variables)

四、多变量线性回归(Linear Regression with Multiple Variables)

4.1 多维特征

目前为止，我们探讨了单变量/特征的回归模型，现在我们对房价模型增加更多的特征，例如房间数楼层等，构成一个含有多个变量的模型，模型中的特征为(x₁, x₂,…,x_n,)。
多维特征向量
增添更多特征后，我们引入一系列新的注释：

n 代表特征的数量
x⁽ⁱ⁾ 代表第i个训练实例，是特征矩阵中的第i行，是一个向量（vector）

比如说，上图的：
在这里插入图片描述
- x⁽ⁱ⁾_j代表特征矩阵中第i行的第j个特征，也就是第i个训练实例的第j个特征

支持多变量的假设h表示为：
h_θ(x) = θ₀ + θ₁x₁ + θ₂x₂ + … + θ_nx_n

这个公式中有n+1个参数和n个变量，为了使得公式能够简化一些，引入x₀ = 1，则公式转化为：
h_θ(x) = θ₀x₀ + θ₁x₁ + θ₂x₂ + … + θ_nx_n

此时模型中的参数是一个n+1维的向量，任何一个训练实例都是n+1维的向量，特征矩阵X的维度是m*(n+1)。因此公式可以简化为：h_θ(x) = θ^TX，其中上标T代表矩阵转置。

4.2 多变量梯度下降

同样地，在多变量线性回归中，代价函数是所有建模误差的平方和，即：
多变量线性回归的代价函数
其中：h_θ(x) = θ^TX = θ₀ + θ₁x₁ + θ₂x₂ + … + θ_nx_n

我们的目标和单变量线性回归问题一样，需要找出使得代价函数最小的一系列参数。多变量线性回归的批量梯度下降算法为：
在这里插入图片描述
即：

求导数后得到：

开始随机选择一系列的参数值，计算所有的预测结果后，再给所有的参数一个新的值，如此循环直到收敛

python代码示例：

	def computeCost(X, y, theta):
	    inner = np.power(((X * theta.T) - y), 2)
	    return np.sum(inner) / (2 * len(X))

4.3 梯度下降法实践1-特征缩放

面对多维特征问题，由于不同的特征量具有不同的含义和数值，需要要保证这些特征都具有相近的尺度，这将帮助梯度下降算法更快地收敛，解决的方法是尝试所有的特征尺度都尽量缩放到-1~1之间。
在这里插入图片描述
通用的最简单的方法是令：x_n = (x_n - μ_n)/s_n，其中μ_n是平均值，s_n是标准差

4.4 梯度下降法实践2-学习率

梯度下降算法收敛所需要的迭代次数根据模型的不同而不同，不能提前预知，但可以绘制迭代次数和代价函数的图表来观测算法在何时趋于收敛。
在这里插入图片描述
此外还有一些自动测试是否收敛的方法，例如将代价函数的变化值与某个阈值（例如0.001）进行比较，但通常看上面的图标会更好。

梯度下降算法的每次迭代受到学习率 α 的影响，如果学习率 α 过小，则达到收敛所需的迭代次数会非常高；如果学习率 α 过大，每次迭代可能不会减小代价函数，可能会越过局部最小值导致无法收敛。

4.5 特征和多项式回归

如房价预测问题：

在这里插入图片描述 h_θ(x) = θ₀ + θ₁ ✖ frontage + θ₂ ✖ depth
x₁ = frontage（临街宽度），x₂ = depth（纵向深度），x = frontage * depth = area（面积），则h_θ(x) = θ₀ + θ₁ x。
但是线性回归并不适用于所有数据，根据数据情况，有时需要曲线来适应我们的数据，比如一个二次方模型：或者三次方模型： h_θ(x) = θ₀ + θ₁ x₁ + θ₂ x₂²，或者三次方模型：
在这里插入图片描述

通常，需要现观察数据然后再决定准备尝试可能的模型，另外，我们可以将复杂模型转化为线性回归模型：
x₂= x₂²，x₃ = x₃³

那如果选择/转化多项式回归模型，在运行梯度下降算法前，特征缩放很有必要：

wenxingxingxing

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ML course_week2

记录机器学习、数据挖掘、统计模式识别的课程。主题包括：（一）监督学习（参数/非参数算法，支持向量机，核函数，神经网络）。（二）无监督学习（聚类，降维，推荐系统，深入学习推荐）。（三）在机器学习的最佳实践（偏差/方差理论；在机器学习和人工智能创新过程）。............
复制链接

扫一扫