【统计学习课程】1 线性回归

最新推荐文章于 2023-03-04 21:58:16 发布

Jiaxi_Cao

最新推荐文章于 2023-03-04 21:58:16 发布

阅读量830

点赞数 4

文章标签：算法机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40613549/article/details/105953746

版权

总结自刘东老师《统计学习》课程，教材选用周志华老师《机器学习》西瓜书
每节都给了小结，可以快速了解每节内容

From 1 to 2

从简单的问题入手

问题：珠穆朗玛峰的高度是多少？

答案1：给出一个变量值：8848米

答案2：从数据中获取知识
有一系列测量值{ $y_1,y_2,...,y_n$ }，则给出结果
$\hat{y}=\frac{y_1+y_2+...+y_n}{n}$

几何平均的意义：
1.最小二乘法的估计结果
2.统计解释：极大似然的估计结果（将珠穆朗玛峰的高度看作高斯分布，这时不仅能估计均值，还能估计方差）

考虑相关变量
珠穆朗玛峰高度和四季有关，则定义
$y = a x + b$
y是高度，x是季节，将春夏秋冬简单的量化为0，1，2，3，则采样可以得到类似如下的图
在这里插入图片描述
通过最小二乘法可以得到如下的拟合结果

显然这个结果并不够好，那么将变量重新映射为

夏季	春季/秋季	冬季
1	2	3

那么拟合的结果会变为
在这里插入图片描述

统计解释

将(y-(ax+b))看作一个0均值的高斯分布变量，也可以用统计学的角度对其进行极大似然估计

小结

1 常用的均值估计与最小二乘法、极大似然估计的关系
2 最小二乘拟合与极大似然估计存在关联，但不存在因果关系
3 变量的重映射很重要！

正则化 Regularization

为什么要有正则化

对待估计的参数进行约束。

考虑上一节的问题，y=ax+b中，显然季节与珠穆朗玛峰高度变化的关系较小，这时就要对a的大小进行限定。
我们有2种约束方法：
1、给定a的范围，求最小平方误差的解
2、同时最小化最小平方误差和a的值

第一种，即有约束问题
$\min\sum{(y_i-(ax_i+b))^2} ,\quad a^2≤C$
第二种，即无约束问题
$\min\sum{(y_i-(ax_i+b))^2}+\lambda a^2$
这两种形式是等价的，也就是说有约束优化问题和无约束优化问题可以互相转化，这种转化通过添加（或减去）正则化项实现。

对于一般情况
$\min f(x),subject \quad to \quad g(x)=0,h(x)≤0$

最低0.47元/天解锁文章

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【统计学习课程】1 线性回归

总结自刘东老师《统计学习》课程，教材选用周志华老师《机器学习》西瓜书每节都给了小结，可以快速了解每节内容线性回归From 1 to 2从简单的问题入手统计解释小结正则化 Regularization为什么要有正则化理解KKT条件正则化的贝叶斯解释小结基函数 Basis Function变量重映射统计解释几何解释等效核函数小结偏差-方差分解偏差与方差的trade-off小结常用的正则化形式L范数...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。