机器学习-线性回归(一)

最新推荐文章于 2021-11-08 17:24:38 发布

echoy_189

最新推荐文章于 2021-11-08 17:24:38 发布

阅读量155

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31405629/article/details/100102320

版权

640?wx_fmt=png

Spark推荐系统，干货，心得

点击上方蓝字关注～

回归问题的学习等价于函数拟合：使用一条函数曲线使其很好的拟合已知函数且很好的预测未知数据

一元线性回归：

回归分析只涉及到两个变量的，称一元回归分析

y = ax + b

案例

640?wx_fmt=png

目标

试图学到一条线性模型尽可能准确地预测新样本的输出值

分析

数据点可视化

640?wx_fmt=png

找出一条最合适的线来拟合所有的数据点

误差

真实值和预测值之间肯定存在差异，用ε表示

对于每个样本

640?wx_fmt=png

640?wx_fmt=png

中心极限定理：中心极限定理，是指概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础，指出了大量随机变量近似服从正态分布的条件。

在自然界与生产中，一些现象受到许多相互独立的随机因素的影响，如果每个因素所产生的影响都很微小时，总的影响可以看作是服从正态分布(忘记的可以百度百科)。

第i个样本实际的值等于预测的值加误差

假定所有的样本都是独立的，有上下的震荡，震荡任务是随机变量，足够多的随机变量叠加之后形成的分布，根据中心极限定理，它服从的就是正态分布，也就是高斯分布。

既然误差和均值为0，方差为平方的正态分布，那么我们可以把它的概率密度函数写出来

预测值与误差：

640?wx_fmt=png

误差代入概率密度函数：

640?wx_fmt=png

将1式代入2式：

640?wx_fmt=png

最大似然估计：给定一堆数据，假如我们知道它是从某一种分布中随机取出来的，可是我们并不知道这个分布具体的参数，即“模型已定，参数未知”

知道这个分布是正态分布，但是不知道均值和方差；或是二项分布，但是不知道均值。最大似然估计(MLE, Maximum Likelihood Estimation)就可以用来估计模型的参数。MLE的目标是找出一组参数，使得模型产生出观测数据的概率最大。

所以似然函数：

640?wx_fmt=png

对数似然：

640?wx_fmt=png

化简并计算w和b

640?wx_fmt=png

求解

将数据代入求得

w = 7.67

b = -10017.36

所以模型

y = 7.67x - 10017.36

640?wx_fmt=jpeg

推荐阅读：

学习人工智能你需要了解的基本概念

机器学习中一些基础的数学

640?wx_fmt=jpeg

长按识别二维码关注我们

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习-线性回归(一)

Spark推荐系统，干货，心得点击上方蓝字关注～回归问题的学习等价于函数拟合：使用一条函数曲线使其很好的拟合已知函数且很好的预测未知数据一元线性回归：回归分析...
复制链接

扫一扫

echoy_189 CSDN认证博客专家 CSDN认证企业博客

码龄9年

43: 原创

-: 周排名

23万+: 总排名

5万+: 访问

: 等级

483: 积分

27: 粉丝

104: 获赞

16: 评论

375: 收藏

私信

关注

热门文章

最新评论

机器学习|GBDT
CSDN-Ada助手: 什么是有监督学习、无监督学习、半监督学习？
数据分析|参数估计
CSDN-Ada助手: 百度的paddlepadle库做的不错，不知道是否用过呢？
一文搞懂知识蒸馏
帆仔菜菜: 个人觉得也许可以这么理解，作为学生（也就是Net-S）， 1. 不仅要自己学习怎么把题目做对（也就是自身的答案和ground-truth之间的分布差异，即Loss-hard）； 2. 还要学习老师是怎么做题的，汲取老师的知识（即学生学到的知识（Net-S的logits）和老师学到的知识（Net-S的logits）之间的Loss-soft）
一文搞懂知识蒸馏
帆仔菜菜: 这里作者的原话是“在经过了softmax转化后，基本也就变成和[1,0,0]无差异的一个结果了” 并不是说直接变成[1,0,0]，而是变成诸如[0.98,0.01,0.01]的一个结果，这样学到的并不是老师的知识（logits），而更偏向于在学习答案（ground-truth）
一文搞懂知识蒸馏
m0_58037034: “Net-S需要学习的两部分知识，分别对应了Net-S的输出和Net-T的分布差异Loss-soft和与GroundTruth的分布差异Loss-hard”请问这个是什么意思呀？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。