机器学习入门笔记（三）

最新推荐文章于 2022-08-06 21:43:23 发布

安徒生的旧时光

最新推荐文章于 2022-08-06 21:43:23 发布

阅读量113

点赞数

分类专栏：机器学习文章标签：岭回归数据归一化特征缩放

本文链接：https://blog.csdn.net/qq_44832672/article/details/91346984

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

特征缩放

如下图的数据情况
在这里插入图片描述
图中的房子价格与房间数量大小相差较大，因此在回归预测时所得的模型可能不够准确。
因此引入特征缩放，常用的特征缩放方法由两种：
(一)数据归一化：把数据的取值范围处理为0~1或者 -1~1
任意数据转化为0~1之间：newValue=(oldValue-min)/(max-min)
任意数据转化为-1~1之间：newValue=[(oldValue-min)/(max-min)-0.5]*2
(二)均值标准化： newValue=(oldValue-u)/s
u为平均值，s为方差。

交叉验证法

当数据集数量太少时，用该方法做模型训练，以得到最小的误差。如下图所示：
在这里插入图片描述
例如将数据分为10份，每次将其中9分用于训练模型，剩下1份用于测试，如此会有10种不同的结果的误差，最后求误差平均值。

过拟合

过拟合时机器学习中常见且不可避免的情况，具体表现为训练所得的模型在训练集表现好而在测试集表现糟糕，如下列几种情况：
拟合图示
防止过拟合的方法一般分为以下几种：
(1)减少特征数
(2)增加数据量
(3)正则化

注：过拟合在模型上表现为过于复杂

正则化

L1正则化： $J(\theta)=\frac{1}{2m}[\sum_{i=1}^{m}(h_\theta(x_i)-y_i)^2+\lambda\sum_{j=1}^{n}\theta_j]$

L2正则化： $J(\theta)=\frac{1}{2m}[\sum_{i=1}^{m}(h_\theta(x_i)-y_i)^2+\lambda\sum_{j=1}^{n}\theta_j^ 2]$

岭回归

岭回归：在标准方程法中 $X^TX$ 不可逆时（数据特征数n>样本个数m），引入岭回归，将 $X^TX$ 后加入 $\lambda$ I ,其中I为单位阵，最终用标准方程法仍可求得参数w= $(X^TX+\lambda I)^{-1}X^Ty$
岭回归使用L2正则化： $J(\theta)=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x_i)-y_i)^2+\beta\sum_{j=1}^{n}\theta_j^2$
其中 $\beta$ 称为正则系数
用矩阵可写成： $J(\theta)=\frac12(X^T\theta-Y)(X\theta-Y)+\beta\theta^T\theta$
对 $\theta$ 求偏导可知 $\theta=(X^TX+\beta I)^{-1}X^Ty$