1.1 线性模型基础

最新推荐文章于 2022-09-09 20:01:01 发布

小学渣的春天

最新推荐文章于 2022-09-09 20:01:01 发布

阅读量273

点赞数

分类专栏：视觉

本文链接：https://blog.csdn.net/Doctor_Wei/article/details/109569171

版权

视觉专栏收录该内容

12 篇文章 0 订阅

订阅专栏

1.1 线性模型基础

1.1.1 线性模型基本形式

1.1.1.1 线性模型定义

线性模型(linear model)：对于给定 $d$ 个属性描述的实例 $x=(x_1;x_2;\cdots;x_d)$ ，其中， $x_i$ 是 $x$ 在第 $i$ 个属性上的取值，通过属性的线性组合来预测的函数叫线性模型。

非线性模型：在线性模型的基础上引入层级结构或者高维映射

1.1.1.2 线性模型的向量表示

$f(x)=w^{\rm T}x+b$
其中， $w=(w_1;w_2;w_3;\dots;w_d)$ 。
$w$ 表示的是特征向量的权重weight， $b$ 表示的是偏值bias
在这里插入图片描述

举例：在西瓜问题中，如何判断一个西瓜是否是好西瓜，则可以表示成线性模型： $$ f_{好瓜}(x)=\cdot x_{色泽}+0.5 \cdot x_{根蒂}+0.3\cdot x_{敲声}+1 $$

1.1.2 线性回归

1.1.2.1 线性回归的定义

给定数据集 $D=\{(x_1, y_1), (x_2, y_2), \cdots, (x_m, y_m)\}$ ，其中 $x_i=(x_{i1};x_{i2};\cdots;x_{id}), y_i\in R$ ，试图学习得到一个线性模型以尽可能准确的预计实值输出标记的模型叫线性回归模型(linear regression)

1.1.2.2 线性回归的核心问题

$f(x_i)=wx_i+b$

确定上式中 $w$ , $b$ 的值，使得 $f(x_i)≃y_i$

目标：让均方误差最小化
设 $w^*, b^*)$ 为 $(w, b)$ 的解，即：
$(w^*, b^*) = \arg \min_{(w, b)}\sum^m_{i=1}(f(x_i)-y_i)^2\\ = \arg\min_{(w, b)}\sum^m_{i=1}(y_i-wx_i-b)^2$

1.1.2.3 线性回归的解决方法——最小二乘法(least square method)

求解 $w$ 和 $b$ 使得函数
$E_{(w, b)} = \sum^m_{i=1}(y_i-wx_i-b)^2$
最小化的过程，称为线性回归模型的最小二乘“参数估计”(parameter estimation).

将上式分别对 $w$ , $b$ 求偏导可得：
$\frac{\partial E_{(w, b)}}{\partial w} = 2\left(w\sum_{i=1}^mx_i^2 - \sum_{i=1}^m(y_i-b)x_i\right)\\[2ex] \frac{\partial E_{(w, b)}}{\partial b} = 2\left(mb-\sum_{i=1}^m(y_i-wx_i)\right)$
分别令偏导数等于零，即：
$\frac{\partial E_{(w, b)}}{\partial w} =0\\[2ex]\frac{\partial E_{(w, b)}}{\partial b} =0$
即可得到 $w$ ， $b$ 的最优解闭式：
$\frac{\sum_{i=1}^my_i(x_i-\overline{x})}{\sum_{i=1}^mx_i^2-\frac{1}{m}\left(\sum_{i=1}^mx_i^2\right)}$