《机器学习》周志华-CH3（线性模型）

Next---YOLO

已于 2024-09-08 11:32:04 修改

阅读量1k

点赞数 29

分类专栏：西瓜书文章标签：机器学习人工智能

于 2024-08-24 00:16:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51366201/article/details/141434989

版权

西瓜书专栏收录该内容

9 篇文章 0 订阅

订阅专栏

3.1基本形式

在这里插入图片描述
$\alpha$ 个属性描述示例化 $x=(x_1,x_2,...,x_d)$ 其中 $x_i$ 是 $x$ 在第 $i$ 个属性取值。线性模型(liner model)通过属性的线性组合预测函数。

$\begin{equation} f(x)=w_1x_1+w_2x_2+...+w_dx_d+b \tag{3.1} \end{equation}$
将式（3.1）转化为向量形式

$\begin{equation} f(x)=w^T+b \tag{3.2} \end{equation}$

其中 $w=(w_1,w_2,...,w_d)$

$w, b$ 学得后，模型确定

线性模型有很好的解释性，更多非线性模型可在线性模型基础上引入层级结构构成高维映射可得

3.2线性回归

在这里插入图片描述

数据集,其中

有序关系: 连续变化为连续值，如高矮 ${1,0\}$ ；高中低 ${1,0.5,0\}$

不存在有序关系: $k$ 个属性值， $k$ 维向量,例如属性“瓜类”的取值“西瓜”、“南瓜”、“黄瓜”可转化为 $(0, 0, 1), (0, 1, 0), (1, 0, 0)$

线性回归试图学得：

$\begin{equation} f(x)=wx_i+b,使得f(x_i)\approx{y_i} \tag{3.3} \end{equation}$

那么如何确定 $w, b ?$
在这里插入图片描述
多元线性回归

在这里插入图片描述

在这里插入图片描述

从对数转为线性了。

广义线性模型
在这里插入图片描述

$\begin{equation} y=g^{-1}(w^{T}x+b) \tag{3.15} \end{equation}$

$g(\cdot)$ 单调可微。“联系函数”，对数线性回归是广义的特例。

3.3对数几率回归

在这里插入图片描述

考虑二分类任务，输出标记 $y\in\{0,1\}$

线性回归预测值 $z=w^{T}x+b$ ,只需将 $z$ 转换为 $0/1$

最理想的是“单位阶跃函数”（unit-step function）

$\begin{equation} y = \begin{cases} 0 & z<0 \\ 0.5 & z=0 \\ 1 & z>0 \\ \end{cases} \tag{3.16} \end{equation}$

若预测值大于零判为正例，小于零判为反例

在这里插入图片描述
单位阶跃函数不连续

对数几率函数（logistic function）在一定程度上近似单位阶跃函数。是常用的替代函数:

在这里插入图片描述

解读： $y$ 视为样本正例可能性，则 $1 - y$ 是其反例可能性

“几率”：反映作为正例的相对可能性：
$\begin{equation} \frac{y}{1-y} \tag{3.20} \end{equation}$

对数几率
$\begin{equation} ln\frac{y}{1-y} \tag{3.20} \end{equation}$
(3.18)用线性回归模型预测结果去逼近真实标记的对数几率。称为"对数几率回归"。

在这里插入图片描述
通过“极大似然法”估计 $w 和 b$ ，给定数据集 $\{(x_i,y_i)\}^{m}_{i=1}$ ,对数几率回归模型最大化“对数似然”（le-libehood）

在这里插入图片描述

3.4线性判别分析

在这里插入图片描述

线性判别分析(Linear Discriminant Analysis,简称 LDA)是一种经典的线性学习方法,在二分类问题上因为最早由|Fisher,1936]提出,亦称“Fisher 判别分析”

LDA思想： 投影到一条直线上，同类样例尽可能近；异类样例尽可能远。
在这里插入图片描述

投影直线为 $w$

两类样本中心在直线上投影为 $w^{T}u_{0},w^{T}u_{1}$

两类样本的方差： $w^{T}\sum_{0}w,w^{T}\sum_{1}w$
在这里插入图片描述

在这里插入图片描述

3.5多分类学习

考虑 $N$ 个类别 $C_{1},C_{2}...C_{N}$ ,多分类学习基本思路是“拆解法”

$\begin{cases} 1、“一对一” (One{\vee}One) & O{\vee}O \\ 2、“一对其余” (One{\vee}Rest) &O{\vee}R \\ 3、“多对多” (Many{\vee}Many) &M{\vee}M \\ \end{cases}$

给定数据集 $D=\{(x_1,y_1),(x_2,y_2)...(x_m,y_m)\},y_i\in\{c_1,c_2...c_N\}$

$O{\vee}O:$ $N$ 个类别两两配对： $C_N^{2}=\frac{N(N-1)}{2}$ 个分类任务

$O{\vee}R:$ 每次将一个类作为正例，其他部分反例训练 $N$ 个分类器
在这里插入图片描述

$O{\vee}R:$ 为 $N$ 个分类器， $O{\vee}O$ 为 $\frac{N(N-1)}{2}$ 个
$O{\vee}O$ 存储开销，测试时间开销比 $O{\vee}R$ 大
$O{\vee}O$ 每次只用2个， $O{\vee}R$ 用所有，所以 $O{\vee}O$ 训练时间比 $O{\vee}R$ 小。
性能两个差不多

$M{\vee}M:$ 每次将若干个类作为正类，若干个其他类作为反类。正反类构造不能随意。

常用的 $M{\vee}M$ 技术：纠错输出码（Error Correcting Output Codes）EOOC

EOOC步骤：

编码：对 $N$ 个类别进行 $M$ 次划分，每次划分一部分正，一部分反。共产生 $M$ 个训练集，训练 $M$ 个分类器。
解码： $M$ 个分类器分别对测试样本预测，预测组成编码。将预测编码和类别编码比较，返回距离最小的为最终预测。

编码矩阵有多种形式，常见二元码（正、反例），三元码（正，反，停用类）。

在这里插入图片描述
一般而言：

EOOC编码越长，纠错能力越强
编码越长，意味着分类器越多，计算存储都会增大
有效类别数，组合数有限，越过一定值就失去意义

同等长度编码，理论上，任意两类之间编码距离越远，纠错能力越强。

3.6类别不平衡问题

在这里插入图片描述

类别不平衡指分类任务中不同类别训练样例数目相差较大的情况，如998个反例，2个正例，如果全判反， $99.8\%$ 精度，无意义。

线性分类器， $y=w^Tx+b$ ，对 $x$ 预测时， $y > 0.5$ 为正例，否则为反例。几率 $\frac{y}{1-y}$ 反映了正反例的比值

而0.5恰表明分类器认为正反例数目相同， $\frac{y}{1-y}$ >1 预测为正例。（3.46）

实例中，正例为 $m^+$ ,反例为 $m^-$ ，则 $\frac{y}{1-y}>\frac{m^+}{m^-}$ 则预测为正例。（3.47）

**基本策略“再缩放”**

三类方法：

反例“欠采样”
正例“过采样”
“阈值移动”

关注

29
点赞
踩
28

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Next---YOLO CSDN认证博客专家 CSDN认证企业博客

码龄4年

313: 原创

8849: 周排名

7850: 总排名

29万+: 访问

: 等级

3923: 积分

699: 粉丝

704: 获赞

59: 评论

1957: 收藏

私信

关注

热门文章

分类专栏

最新评论

OS第一章作业---操作系统概论
Gbdzs: 您好，想问一下有没有这本书的课后题答案，求一份课后题答案
《机器学习》周志华-CH6（支持向量机）
ha_lydms: 博文细致入微，感谢博主的分享
《机器学习》周志华-CH5（神经网络）
全栈小5: 非常不错的技术领域文章分享，解决了我在实践中的大问题！博主很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，值得收藏点赞。支持【《机器学习》周志华-CH5（神经网络），博主这篇文章，值得一看】
《机器学习》周志华-CH5（神经网络）
豆小匠: 干货啊，周志华的《机器学习》中CH5关于神经网络的讲解非常详尽。从神经元到神经网络的结构，再到反向传播算法和梯度下降法的应用，内容深入浅出，易于理解。尤其是神经网络在实际应用中的案例，让人印象深刻。感谢作者的分享，对于学习神经网络有很大的帮助！
《机器学习》周志华-CH5（神经网络）
DevKevin: 干货啊，周志华的《机器学习》中CH5关于神经网络的讲解非常详尽。从神经网络的原理到结构，再到训练过程和应用实例，内容深入浅出，易于理解。特别是对于一些复杂的概念，如反向传播算法和梯度下降优化等，讲解清晰透彻。感谢作者的分享，对于学习机器学习的人来说，这本书无疑是一本宝贵的资源。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Next---YOLO 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。