机器学习系列之最小二乘法

最新推荐文章于 2024-01-03 13:51:28 发布

leo_fengj

最新推荐文章于 2024-01-03 13:51:28 发布

阅读量967

点赞数 2

分类专栏：机器学习文章标签：最小二乘法机器学习优化算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lionel_fengj/article/details/53728769

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

最小二乘法

最小二乘法，又称最小平方法，是机器学习中基础的算法之一，它是一种优化算法，通过最小化误差的平方来寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之间误差的平方和为最小。在机器学习中，还可以使用最小二乘法来进行曲线拟合。

这里写图片描述
上图介绍的上海市长宁区部分房价的信息，从散点图可以发现，房子的大小和房价彼此之间有一些依赖关系，由房子大小可以决定房子的价格，但是这种关系又是不确定的，这时候我们可以利用统计学中的回归模型来寻找这两个变量之间的关系。具体步骤如下：

画散点图，直观判断；
用近似模型来描述它们的关系，如一元线性模型；
建立回归模型；
对模型进行参数估计，最小二乘法是这些参数估计的一种常用的方法，这也是本篇博文讲述的重点；
讨论模型的效果；

为了描述简单，本篇文章将采用一元线性模型（ ${Y}=w_0+w_1X$ ）建立回归模型来介绍最小二乘法。

Y i^= w 0 + w 1 X i （ 式 1 - 1 ）

$\hat{Y_i}=w_0+w_1X_i（式1-1）$
其中，

Yi^ $\hat{Y_i}$ 是根据回归模型求得的值，则

Yi ${Y_i}$ 和

Yi^ $\hat{Y_i}$ 的差就是该模型的误差。则平方损失函数为：

S = \sum i = 1 n (Y i - Y i^) 2 = \sum i = 1 n (Y i - w 0 - w 1 X i) 2 （ 式 1 - 2 ）

$S=\sum_{i=1}^n (Y_i-\hat{Y_i})^2=\sum_{i=1}^n(Y_i-w_0-w_1X_i)^2（式1-2）$

分别对 $w_0,w_1$ 求偏导得：

\partial S \partial w 0 = - 2 \sum i = 1 n (Y i - w 0 - w 1 X i) （ 式 1 - 3 ）

$\frac{{\partial S}}{{\partial w_0}} =-2\sum_{i=1}^n(Y_i-w_0-w_1X_i)（式1-3）$

\partial S \partial w 1 = - 2 \sum i = 1 n (Y i - w 0 - w 1 X i) (- X i) （ 式 1 - 4 ）

$\frac{{\partial S}}{{\partial w_1}} =-2\sum_{i=1}^n(Y_i-w_0-w_1X_i)(-X_i)（式1-4）$

根据我们的数学知识，函数的极值点为偏导数为0的点。即

\partial S \partial w 0 = 0 （ 式 1 - 5 ）

$\frac{{\partial S}}{{\partial w_0}} =0（式1-5）$

\partial S \partial w 1 = 0 （ 式 1 - 6 ）

$\frac{{\partial S}}{{\partial w_1}} =0（式1-6）$
亦即

n w 0 + \sum i = 1 n (X i) w 1 = \sum i = 1 n Y i （ 式 1 - 7 ）

$n w_0+\sum_{i=1}^n(X_i)w_1=\sum_{i=1}^nY_i（式1-7）$

\sum i = 1 n (X i) w 0 + (\sum i = 1 n x 2 i) w 1) = \sum i = 1 n (X i Y i) （ 式 1 - 8 ）

$\sum_{i=1}^n(X_i)w_0+(\sum_{i=1}^nx_i^2)w_1)=\sum_{i=1}^n(X_iY_i)（式1-8）$

对式1-7和式1-8求解得：

w 0 = \sum n i = 1 Y i n - w 1 \sum n i = 1 X i n （ 式 1 - 9 ）

$w_0=\frac{\sum_{i=1}^nY_i}{n}-\frac{w_1\sum_{i=1}^nX_i}{n}（式1-9）$

w 1 = [n \sum n i = 1 X i Y i - ( \sum n i = 1 X i \sum n i = 1 Y i ) n \sum n i = 1 X 2 i - ( \sum n i = 1 X i ) 2 （ 式 1 - 10 ）

$w_1=[\frac{n\sum_{i=1}^nX_iY_i-(\sum_{i=1}^nX_i\sum_{i=1}^nY_i)}{n\sum_{i=1}^nX_i^2-(\sum_{i=1}^nX_i)^2}（式1-10）$
此时,把

w0,w1 $w_0,w_1$ 带入式1-1，就是我们要求的回归模型。

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习系列之最小二乘法

最小二乘法最小二乘法，又称最小平方法，是机器学习中基础的算法之一，它是一种优化算法，通过最小化误差的平方来寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之间误差的平方和为最小。在机器学习中，还可以使用最小二乘法来进行曲线拟合。上图介绍的上海市长宁区部分房价的信息，从散点图可以发现，房子的大小和房价彼此之间有一些依赖关系，由房子大小可以决定房子的价格
复制链接

扫一扫

专栏目录

leo_fengj CSDN认证博客专家 CSDN认证企业博客

码龄8年

57: 原创

74万+: 周排名

58万+: 总排名

20万+: 访问

: 等级

1965: 积分

34: 粉丝

48: 获赞

18: 评论

144: 收藏

私信

关注

热门文章

分类专栏

并发编程
Python 19篇
Java 13篇
自然语言处理 9篇
数据库 5篇
机器学习 8篇
数据结构 3篇
搜索 1篇
索引 2篇
tensorflow 9篇

最新评论

自然语言处理系列之TF-IDF算法
luckyxs: 换一个用IndexAnalysis.parse
python2 安装 tensorflow 遇到问题
无感中: 解决了，非常感谢
Java-矩阵运算
ember7788: 我想问一下这个库为什么用不起来啊没有source
linux shuf 命令
I am zzxn: shuf命令消耗的内存是O(n)吗？
利用余弦计算文本相似性
chenyanlong_v: import org.ansj.util.FilterModifWord; 你好，关于你的这个工具类，我翻遍了官方的整个文档，也没有找到这个工具类。大佬，能请教一下，你用的是那个版本的吗？[code= /** * 分词 * * @param text 文本 * @return 分词结果 */ private List<String> parse(String text) { if (StringUtils.isBlank(text)) { return null; } List<Term> terms = FilterModifWord.modifResult(ToAnalysis.parse(text)); if (terms == null || terms.size() == 0) { return null; } List<String> words = new ArrayList<String>(); for (Term term : terms) { if (StringUtils.isNotBlank(term.getName())) { words.add(term.getName()); } } return words; }] [/code]

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。