机器学习（周志华）学习笔记（二）

最新推荐文章于 2024-01-20 22:58:37 发布

ELDORADO_KDW

最新推荐文章于 2024-01-20 22:58:37 发布

阅读量1.5k

点赞数

文章标签：机器学习分类回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/coral_55u/article/details/123687285

版权

机器学习（周志华）学习笔记（一）

目录

学习内容：

三、线性模型

3.1 基本形式

3.2 线性回归

3.3 对数几率回归

3.4 线性判别分析(LDA)

3.5 多分类问题

3.6 类别不平衡

学习时间：

学习内容：

三、线性模型

3.1 基本形式

线性模型试图学得一个通过属性的线性组合来进行预测的函数，即：

$f(x)=w_{1}x_{1}+w_{2}x_{2}+....w_{d}x_{d}+b$

一般用向量形式写为：

$f(x)=w^{T}x+b$

其中w和b学到之后，模型就确定下来。w是每一项属性 $x_{i}$ 的权重系数矩阵。

下面将介绍几种经典的线性模型。

3.2 线性回归

在给定数据集 $D={\left \{ \right.(x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m})}\left. \right \}$ 里做线性回归，学得一个线性模型。本质即为确定权重系数w。令：

$f(x_{i})\simeq y_{i}$

如何确定w和b？

->均方误差最小法（在线性回归中即为最小二乘法，试图找到一条直线，使所有样本到直线上的欧氏距离之和最小）

从上面的思想过渡到多元线性回归、对数线性回归。

$y=w^{T}x+b$ (多元线性回归)

$ln y= w^{T}x+b$ (对数线性回归)

其中对数线性回归，实际是是让 $e^{w^{T}x+b}$ 逼近y，形式上仍是线性回归。但至此我们只能对数据集回归出两种线（直线、 $e^{x}$ 曲线），但这远远不能满足具有其它潜在关系的数据集。故更一般地，考虑单调可微函数g(·):

$y=g^{-1}(w^{x}+b)$

这样得到的模型称为“广义线性模型”，其中函数g(·)称为联系函数。现在我们可对大部分具有线性关系的数据集进行回归。

3.3 对数几率回归

上述我们解决了利用线性模型进行回归学习，但若要做分类任务该怎么办？

-> 特殊的g(·)函数

理想情况下，单位阶跃函数是最好的选择。但是单位阶跃函数不连续，不满足可微。所以我们需要找到近似单位阶跃函数的代替品，并希望它单调可微。而对数几率函数正是这样一个常用的替代函数。

$y=\frac{1}{1+e^{-z}}$

在这里我们要特别注意，虽然名字是对数几率回归，但实际上确实一种分类学习方法。

如何确定w和b？

-> 极大似然法

3.4 线性判别分析(LDA)

LDA是一种经典的线性学习方法，也叫Fisher判别分析。

LDA的思想：给定训练样例集，设法将样例投影到一条直线上，使得同类样例的投影点尽可能接近、异类样例的投影点尽可能远离。在对新样本进行分类时，将其投影投影到这条直线上，再根据投影的位置点来确定新样本的类别。

当两类数据同先验、满足高斯分布且协方差相等时，LDA可达到最优分类。

投影的操作可以减少样本点的维数，并且投影过程中使用了类别信息，因此LDA常被视为一种经典的监督降维技术。

3.5 多分类问题

有些二分类方法可以直接推广到多分类，但更多情况下，是利用二分类学习器来解决多分类问题。

多分类学习的基本思路是“拆解法”，即将多分类任务拆分为若干个二分类任务求解。其中最经典的拆分策略有三种：“一对一”OvO，“一对其余”OvR，“多对多”MvM。

OvO：将N个类别两两配对，从而产生N(N-1)/2个分类问题（分类器）。在测试阶段，将新样本同时提交给所有分类器，并产生N(N-1)/2个结果，最终结果通过投票产生。

OvR：每次将一个类的样例作为正例，所有其他类的样例作为反例；从而训练N个分类器。在测试时若仅有一个分类器预测为正类，则对应的类别标记为最终分类；若有多个分类器预测为正类，则通常考虑分类器的置信度，选择置信度最大的类别标记作为分类结果。

MvM：每次将若干个类作为正类，若干个其它类作为反类。但正反类构造必须有特殊的设计，不能随便选取。这里纠错输出码（EOOC）就是一种最常见的MvM技术。ECOC工作过程分为两步：

①编码：对N个类别做M次划分，每次划分将一部分化为正，一部分化为反，从而形成一个二分类训练集，这样一共产生M个训练集，可以训练M个分类器。

②解码：M个分类器分别对样本进行预测，这些预测标记组成一个编码，将这个预测编码与每个类别的各自编码进行编码，返回其中距离最小的类别作为预测结果。

一般来说。对于同一个学习任务，ECOC编码越长，纠错能力越强；对于同等长度的编码，理论上来说，任意两个类别之间的编码距离越远，纠错能力越强。

3.6 类别不平衡

是指分类任务中不同类别的训练样例数目差别很大的情况。如何解决？

->欠采样：去除一些样例数较多的类别样本。

->过采样：添加一些样例数较少的类别样本。

->再缩放/阈值移动：直接基于原始训练集进行学习，但在预测时嵌入:

$\frac{y^{'}}{1-y^{'}}=\frac{y}{1-y}\ast \frac{m^{-}}{m^{+}}$

其中 $m^{-}$ 是反例数目， $m^{+}$ 是正例数目

学习时间：

15：30-17：04

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
机器学习（周志华）学习笔记（二）

机器学习（周志华）学习笔记（一）学习内容：三、线性模型3.1 基本形式线性模型试图学得一个通过属性的线性组合来进行预测的函数，即：一般用向量形式写为：其中w和b学到之后，模型就确定下来。w是每一项属性的权重系数矩阵。下面将介绍几种经典的线性模型。3.2 线性回归在给定数据集里做线性回归，学得一个线性模型。本质即为确定权重系数w。令：如何确定w和b？->均方误差最小法（在线性回归中即为最小二乘法，试图找到一条直线，使所有样本到直线上的...
复制链接

扫一扫

ELDORADO_KDW CSDN认证博客专家 CSDN认证企业博客

码龄5年

12: 原创

33万+: 周排名

23万+: 总排名

1万+: 访问

: 等级

144: 积分

8: 粉丝

10: 获赞

13: 评论

69: 收藏

私信

关注

热门文章

最新评论

GCNV2_SLAM 环境配置 Ubuntu18.04
ELDORADO_KDW: 看下Viewer.cc的源码吧应该会有详细介绍
GCNV2_SLAM 环境配置 Ubuntu18.04
GNC206xi: 麻烦问下gcn2slam如何调整窗口大小呢,我发现320*420 和 640*480窗口大小一样的
OnnxRuntime 将pytorch模型部署到C++并推理 ubuntu18.04
CSDN-Ada助手: 恭喜您写完了第12篇博客！标题看起来非常吸引人，我很期待阅读您关于将pytorch模型部署到C++并推理的经验分享。您的博客已经给读者们提供了很多有价值的内容，对于想要深入了解这个主题的人来说，无疑是一本宝典。在下一步的创作中，我想提出一个谦虚的建议。或许您可以考虑进一步探索如何将OnnxRuntime与其他平台或框架集成，以便为更多开发者提供帮助和指导。此外，您也可以分享一些实际应用中的挑战与解决方案，这将是非常有用的。再次恭喜您，期待您未来更多的博客作品！
Java SendEmail jdk20
CSDN-Ada助手: 恭喜您写下了第7篇博客！标题看起来非常有吸引力，我很期待阅读您关于Java SendEmail的内容。您的持续创作精神令人钦佩，希望您能继续保持下去。对于下一步的创作建议，或许您可以考虑深入探讨一些与Java SendEmail相关的高级主题，或者分享一些实践经验和技巧，这样将更有助于读者的学习和应用。期待您的更多精彩作品！
数据结构算法学习记录
CSDN-Ada助手: 恭喜您写了第8篇博客！标题为“数据结构算法学习记录”，看起来很有深度和实用性。您的持续创作展示了您对数据结构和算法的热情和努力。在下一步的创作中，我建议您可以尝试分享一些具体的应用案例，或者对某些常见问题的解决方案进行深入分析。这样可以使读者更好地理解和应用所学内容。期待您的更新，继续加油！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。