机器学习(西瓜书笔记) 第3章线性模型

最新推荐文章于 2024-07-06 19:05:11 发布

DannyKX

最新推荐文章于 2024-07-06 19:05:11 发布

阅读量158

点赞数

文章标签：机器学习线性代数 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42386103/article/details/120781526

版权

第3章线性模型

文章目录

第3章线性模型

3.1 基本形式

线性模型函数公式：
$f(x)=w_1x_1+w_2x_2+\dots+w_dx_d+b$
线性模型的向量公式：
$f(x)=w^Tx+b$

3.2 线性回归(Linear regression)

def :线性回归试图学得一个线性模型，以尽可能准确地预测真实值

公式：
$f(x_i)=wx_i+b,使得f(x_i)\simeq y_i$

3.3 对数几率回归

将z转化成接近0或1的y值

公式：
$y=\frac{1}{1+e^{-z}}$

3.4 线性判别分析(Linear Discriminant Analysis–LDA)

思路：给定训练样例集，设法将样例投影于一条直线上，使同类样例的投影点尽可能接近，异类样例的投影点尽可能远离；在对新样本分类时，将其投影到同样这条线上，再根据投影点位置判断样本类别。

分类：2分类LDA和多分类LDA

①.2分类LDA

LDA欲优化目标：
$J=\frac{w^Ts_bw}{w^Ts_ww}$
其中：
$w=s_w^{-1}(\eta_0-\eta_1)$

$s_b=(\eta_0-\eta_1)(\eta_0-\eta_1)^T$

$s_w=\Sigma_0+\Sigma_1=\sum_{x\epsilon x_0}(x-\eta_0)(x-\eta_0)^T+\sum_{x\epsilon X_1}(x-\eta_1)(x-\eta_1)^T=U\Sigma V^T$

$\eta0 -表示第0类样本的均值向量$

$\eta1 -表示第1类样本的均值向量$

$\Sigma-一个对角矩阵，对角线元素之和为s_w的奇异值$

②多分类LDA

意义：
将w视为投影矩阵，多分类LDD将样本投影到d’维空间，由于d’通常远小于原d(数据原有的属性)，故可通过此方法减小样本点的维数
优化目标：
$max_{x}\frac{tr(w^Ts_bw)}{tr(w^Ts_ww)}$
广义优化目标：
$s_bw=\lambda s_ww$
其中：
$s_t=s_b+s_w= \sum_{i=1} ^m(x_i-\eta)(x_i-\eta)^T$

$s_{w_i}=\sum_{x\in x_i}(x-\eta_i)(x-\eta_i)^T$

$s_w=\sum_{i=1}^Ns_{w{i}}$

$s_b=s_t-s_w=\sum_{i=1}^Nm_i(\eta_i-\eta)(\eta_i-\eta)^T$

$W-是s_w^{-1}s_b的d^{’}个最大非零广义特征值所对应的特征向量组成的矩阵，其中d^{'}\leq N-1$

3.5 多分类学习

不清楚啥用

3.6 类别不平衡问题

1.定义：

类比额不平衡（class-imbalance）问题指分类任务中不同列别的训练样例数目差别很大的情况。例如有998个反例，但正例仅有2个，那么学习方法只需返回一个永远将新样本预测为反例的学习器，即可达到99.8%的精度，但是这个学习器没有价值，因为它不能预测出任何正例

2.策略：

再缩放(rescaling):
$\frac{y^{’}}{1-y^{'}}=\frac{y}{1-y}\times\frac{m^{-}}{m^{+}}$
3种再缩放的方式：

欠采样(undersampling):

对训练集中的反例欠采样，去除一些反例使得正反比例数目接近，然后再学习

过采样(oversampling):

对训练中的正例进行过采样，增加一些正例使得正反例数目接近，然后再学习

阈值移动(threshold-moving):

直接基于原始训练集进行学习，但在用测试好的分类器进行预测时，将再缩放公式嵌入到决策过程中

3.代价敏感学习：
$代价敏感学习=\frac{y}{1-y}\times \frac{cost^{+}}{cost^{-}}$
其中：
$cost^{+}-将正例误分为反例的代价$

$cost^{-}-将反例误分为正例的代价$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习(西瓜书笔记) 第3章线性模型

第3章线性模型3.1 基本形式线性模型函数公式：f(x)=w1x1+w2x2+⋯+wdxd+bf(x)=w_1x_1+w_2x_2+\dots+w_dx_d+bf(x)=w1x1+w2x2+⋯+wdxd+b线性模型的向量公式：f(x)=wTx+bf(x)=w^Tx+bf(x)=wTx+b3.2 线性回归(Linear regression)def :线性回归试图学得一个线性模型，以尽可能准确地预测真实值公式：f(xi)=wxi+b,使得f(xi)≃yif(x_i)=
复制链接

扫一扫

DannyKX CSDN认证博客专家 CSDN认证企业博客

码龄6年

5: 原创

120万+: 周排名

77万+: 总排名

2156: 访问

: 等级

97: 积分

3: 粉丝

4: 获赞

3: 评论

24: 收藏

私信

关注

热门文章

最新评论

机器学习(西瓜书)学习笔记
iml6yu: 能分享一下你的在线视频课堂吗？地址发给我一下吧
机器学习(西瓜书)学习笔记
DannyKX: 刚开始尽量速度过一遍书本，推荐学堂在线周志华老师的西瓜书视频教程。和这本书配套的
机器学习(西瓜书)学习笔记
iml6yu: 兄弟，你西瓜书学的怎么样了，我尝试了好几个月了，一直学不下去，总是被数学卡住

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。