《西瓜书》+《南瓜书》第三章笔记（Datawhale）(未完成..)

游弋诗

已于 2022-03-22 15:26:57 修改

阅读量1.1k

点赞数

分类专栏：机器学习文章标签：机器学习

于 2022-03-21 23:42:47 首次发布

本文链接：https://blog.csdn.net/weixin_41235304/article/details/123648677

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

第三章线性模型

3.1基本形式

d个属性描述示例 $x=(x_1,x_2,...x_d)$ 其中 $x_i$ 是 $x$ 在第 $i$ 个属性取值。
线性模型（linear model）通过属性的线性组合预测函数
$f(x)=w_1x_1+w_2x_2+...+w_dx_d+b \tag{3.1}$
转化成转化成向量形式
$f(x)=w^T+b\tag{3.2}$
其中 $w^T$ 中的 $T$ 表示“将向量取转置,一般线性代数中指的向量为列向量,取了转置后就是行向量.”PS：具体作用以及意义后续待完善…（主要是不记得了…）
其中 $w=（w_1,w_2,...w_d）$
最终 $w, b$ 学得后，模型确定。

线性模型有很好的解释性，更多非线性模型可在线性模型基础上引入层级结构或高维映射可得。

3.2线性回归

数据集 $D=\{(x_1,y_1),(x_2,y_2), ...,(x_m,y_m)\}$ ,其中 $x_i=(x_{i1};x_{i2};...;x_{id}),y_i\in R$
转化为 $\{(x_i,y_i)\}^m_{i=1}$ ,其中 $x_i\in R$

有序关系：连续转化为连续值，如高矮 ${1,0\}$ ;高中低 ${1,0.5,0\}$
不存在有序关系： $k$ 个属性值， $k$ 维向量，如“西瓜”“黄瓜”“南瓜”，转为向量
$(0, 0, 1) (0, 1, 0) (1, 0, 0)$

线性回归试图学得：
$f(x_i)=wx_i+b,最终使得f(x_i) \approx y_i \tag{3.3}$

最终问题变为如何求得 $w, b$ ,使得 $f(x_i) \approx y_i$
$(w^*,b^*)=\mathop{argmin}\limits_{(w,b)}\sum_{i=1}^{m}(f(x_i)-y_i)^2 \tag{3.4} \\=\mathop{argmin}\limits_{(w,b)}\sum_{i=1}^{m}(y_i-wx_i-b)^2$
通过最小二乘法进行线性回归、拟合，计算欧式距离，使得均方差最小化。
$\mathop E(w,b)= \sum_{i=1}^{m}(y_i-wx_i-b)^2$

求解 $w$ 和 $b$ 使得 $E (w, b)$ 最小化的过程，称为线性回归模型的最小二乘参数估计（parameter estimation）。将 $E (w, b)$ 对 $w$ 和 $b$ 求导可得：

$\frac{\partial{E(w,b)}}{\partial{w}}=2(w{\sum_{i=1}^{m}x^2_i}-{\sum_{i=1}^{m}(y_i-b)x_i}) \tag{3.5}$
$\frac{\partial{E(w,b)}}{\partial{b}}=2(mb-{\sum_{i=1}^{m}(y_i-wx_i)}) \tag{3.6}$
令（3.5），（3.6）为零求最优解得：
$w=\frac{\sum_{i=1}^{m}y_i(x_i-\overline{x})}{\sum_{i=1}^{m}x^2-\frac{1}{m}(\sum_{i=1}^{m}x)^2} \tag{3.7}$
其中 $\overline{x}=\frac{1}{m}{\sum_{i=1}^{m}x_i}$
$b=\frac{1}{m}{\sum_{i=1}^{m}(y_i-wx_i)}\tag{3.8}$