西瓜书学习笔记（线性回归）

最新推荐文章于 2023-07-16 21:15:49 发布

leo2vec

最新推荐文章于 2023-07-16 21:15:49 发布

阅读量540

点赞数

分类专栏：机器学习笔记心得文章标签：线性回归机器学习概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43274397/article/details/121484542

版权

机器学习笔记心得专栏收录该内容

1 篇文章 0 订阅

订阅专栏

datawhale的组队打卡活动，目前自己没啥干货，笔记也仅限于自己能够读懂，欢迎如果有看到的小伙伴交流。

第三章线性模型

来源于datawhale开源学习

南瓜书课程：

一元线性回归

1.算法原理

1.1预习西瓜书上不太懂的公式

（argmax(f(x))是使得 f(x)取得最大值所对应的变量点x(或x的集合)。arg即argument，此处意为“自变量）

其余基本等同已经学习过的多元回归分析课程

1.2“发际线高度和计算机水平的例子”

成一个直线型关系，曲线去拟合数据，为什么不用曲线，这样考虑到了误差，容易过拟合。

f(x)=w x+b

误差若是点到直线的距离最小，即是正交回归。线性回归考虑的是平行于y轴的距离。

均方误差：竖向误差之和，保持正的就加了个平方。

有序多值（离散）：比如饭量，有大小之分，小：1，中：2，大：3

无序多值（离散）：比如颜色，黄[1,0,0],黑[0,1,0],白[0,0,1] 无明显先后顺序

1.3最小二乘估计

aigmin函数指的是，使得f(x)值最小的时候的x值

1.4 极大似然估计

考研概率论已经讲过了（略学）

x是X的n个独立同分布的样本，关于待估计参数，使得联合概率（似然函数）L取到最大时的待估计参数就是其估计值。

一般是连乘概率密度函数，用取对数变成加法，求导即可

可以考虑误差，加一个误差项，其服从均值为零的正态分布，从而可以导出来关于y的概率分布。

奇妙的现象，最大似然估计和最小二乘殊途同归

凸函数求值问题，（跟课本定义不太一样，向下凸为凸函数）

推导思路：1.证明E(w,b)是个凸函数。2.凸函数求最值来求出w和b

凸集：在集合内任意两个点，两点之间的任意连线仍属于这个集合。

凸函数：比如y=x(^2)，中点函数值小于等于两端函数值平均（不一定中点，可以按比例分）（此处凹凸定义和高数书相反）

1.5 求解w和b

利用梯度去求。

多元函数的二阶导数即海塞矩阵

如果f(x)在凸集上的海塞矩阵是半正定的，就可以判定函数是凸函数。

图片来自南瓜书推导，跟着推导一遍后，感觉良好。

半正定矩阵判定方法：顺序主子式都是非负的。

即要求这个式子是不是非负的

中间一步的代换最为关键。

（印象这个推导也可以从方差定义中和的平方和平方的和角度着手。下来再总结一下）

到这里，基本能证明了E是一个凸函数，然后告知怎么使E最小，梯度为零即可，类似一元函数中的导数为零之处。

后面3.8 可以按照这种方法求解出来，略

注意可以把w向量化使得本应该用for循环的求和转变为numpy的矩阵求解，大大降低运算复杂度。见南瓜书的3-7的解析。

机器学习三要素（李航老师的《统计学习方法》也提到过）

模型：根据问题确定假设空间。（一次项还是二次项）
策略根据评价标准，选择一个最优模型的策略，一般也会产生一个“损失函数”（均方误差，正交误差，找出损失函数）
算法根据损失函数，确定最优模型（本例子中求出w，b，本次中闭式，能解出，比如神经网络，求不出来闭式）算法可以有很多，比如牛顿迭代法，梯度下降法。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
西瓜书学习笔记（线性回归）

datawhale的组队打卡活动，目前自己没啥干货，笔记也仅限于自己能够读懂，欢迎如果有看到的小伙伴交流。第三章线性模型来源于datawhale开源学习南瓜书课程：一元线性回归1.算法原理1.1预习西瓜书上不太懂的公式（argmax(f(x))是使得 f(x)取得最大值所对应的变量点x(或x的集合)。arg即argument，此处意为“自变量）其余基本等同已经学习过的多元回归分析课程1.2“发际线高度和计算机水平的例子”成一个直线型关系，曲线去拟合数据，为什么.
复制链接

扫一扫

专栏目录

leo2vec CSDN认证博客专家 CSDN认证企业博客

码龄6年

10: 原创

108万+: 周排名

173万+: 总排名

3024: 访问

: 等级

100: 积分

1: 粉丝

0: 获赞

2: 评论

3: 收藏

私信

关注

热门文章

分类专栏

机器学习笔记心得 1篇

最新评论

数据结构Day6 哈希表：242.有效的字母异位词 349. 两个数组的交集 202. 快乐数 1. 两数之和
CSDN-Ada助手: 恭喜您写了第8篇博客，内容丰富多彩，涵盖了哈希表的应用。我觉得下一步可以考虑深入探讨哈希表的实现原理，或者介绍一些常见的哈希函数。谢谢您的分享，期待更多精彩的博客。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
数据结构Day3 203.移除链表元素 707.设计链表 ● 206.反转链表
CSDN-Ada助手: 恭喜你写了第7篇博客，标题看起来很有实用性。移除链表元素和设计链表是常见的链表操作，而反转链表则是常用的技巧之一。感谢你分享这些知识，希望你能继续坚持写作。下一步的创作建议，可以考虑分享一些高级数据结构或者算法的实现，这能帮助读者更深入地理解这些概念。再次感谢你的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
数据结构Day2 977有序数组的平方 209 长度最小的子数组 59螺旋矩阵（2⃣️）
CSDN-Ada助手: 恭喜您写下了第6篇博客，标题看起来非常有趣和有用！我非常期待阅读您的文章，并且感谢您对数据结构的深入研究和分享。如果可能的话，我建议您在接下来的文章中加入更多的代码示例和解释，这样读者们更容易理解并且能够更好地应用到实际中。再次感谢您的分享，期待您的下一篇文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
数据结构Day1 704. 二分查找，27. 移除元素
CSDN-Ada助手: 恭喜您写出了第5篇博客，标题内容也很有意义。二分查找和移除元素是数据结构中非常基础的操作，您的分享对于初学者来说非常有帮助。接下来，我建议您可以结合实际场景，给出更多的案例或者代码实现，让读者更好地理解和应用这些知识点。期待您更多的精彩分享！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

leo2vec 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。