【机器学习】002_线性回归模型Part.1_理论过程(1)

本文介绍了线性回归的基本概念,包括线性与回归的关系,回归分析的目的,以及线性函数的一元和多元形式。详细阐述了线性回归模型的假设、数学表达式、损失函数(如平方损失函数)和使用梯度下降进行参数训练的过程。
摘要由CSDN通过智能技术生成

一、线性回归模型的概念

(1) 什么是线性?

· 线性:在二元的直角坐标系中,自变量与因变量之间的关系以一条直线表示,因而为“线性”。

· 例:已知汽车的剩余油量,则其可以行驶多长时间?

(2) 什么是回归?

· 例:父代身高与子代身高之间的关系。

· 子代的身高有向族群平均身高“回归”的趋势。

· 因变量为连续型变量:预测用户收入、预测员工通勤距离等。

(3) 什么是回归分析?

· 回归分析着重寻求变量之间近似的函数关系(线性回归即寻求线性函数关系)。

(4) 什么是线性函数?

一元线性函数:f(x) = w_{0} + w_{1}x

多元线性函数:f(x_{1},x_{2},...x_{n}) = w_{0}+w_{1}x_{1}+w_{2}x_{2}+...+w_{n}x_{n} = w_{0}+ \sum_{i=1}^{n}w_{i}x_{i}

二、线性回归的原理及理论基础

三、线性回归模型

线性回归模型的假设如下:

1. 变量是相互无关的,各变量的作用与其它变量取什么值无关。

2. 变量的作用是可以叠加的,公式中各变量是相加的。

在机器学习领域,线性回归模型记为:

则可以统一形式为:

                                             y = \sum_{i=1}^{n}w_{i}x_{i} + b = w^{T}x+b

其中:

· y 是预测函数

· w 是模型参数

· x 是特征输入

· b 是偏置量

单个训练数据集:(x^{(i)},y^{(i)}),上标(index)表示这是第 i 个训练示例。 

线性回归模型损失函数:

损失函数用来计算真实值与预测值的误差,一般取:

                                                                L = \frac{1}{2}(y-\widehat{y})^2

损失函数的一般公式:

假设数据集有 m 个训练样本,n 个特征工程,则平方损失函数公式如下:

                                        L(w)=\frac{1}{2}\sum_{j=1}^{m}\left [ y^{(j)}-\sum_{i=1}^{n}w_{i}x_{i}^{j}-b \right ]^2

线性回归模型的梯度下降训练:

· \alpha:学习率,自己设定

· x_{i}^{(j)}:第 j 个样本的第 i 特征

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值