机器学习03 线性模型

思想在拧紧

已于 2023-01-24 00:42:02 修改

阅读量504

点赞数

分类专栏：机器学习

于 2023-01-24 00:18:52 首次发布

本文链接：https://blog.csdn.net/what_how_why2020/article/details/128754913

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

前言：本章先介绍如何使用线性模型（linear model）处理回归任务，再考虑经由映射函数处理二分类任务的对数几率回归（logistic regression, 或 logit regression），和利用样本点投影距离处理二分类任务的线性判别分析（Linear Discriminant Analysis, LDA），最后介绍多分类学习，并指出类别不平衡问题及再缩放（rescaling）的应对策略。

知识点

输入属性若存在序关系（order），可通过连续化转为连续值；不存在序关系，则转化为n维向量，若将其连续化，则对距离计算等造成误导（9.3节）

线性判别分析（Linear Discriminant Analysis, LDA）的思想：异样本的投影尽可能远；同样本的投影尽可能近。

多分类学习处理思路：拆解法，将多分类任务拆为若干个二分类任务求解。具体策略有“一对一”（One vs. One, OVO）、“一对其余”（One vs. Rest, OvR）和“多对多”（Many vs. Many, MvM）。

拆解策略	特点
OvO	将N个类别任意两两配对，产生 N(N-1)/2 个二分类任务。
OvR	产生 N 个分类任务。训练每个训练器使用全部训练样例
MvM	将若干个类作为正类，若干其他类作为反类。正反例构造需要使用纠错输出码（Error Correcting Output Codes. ECOC）

类别不平衡问题：分类任务中不同类别的训练样例数目不相当（如，正例有998个，而反例有2个）。

存在于不同类别的训练样例数不同的原始问题中，也存在于处理多分类时拆解分类任务后。

处理方法：再缩放（rescaling）–对训练集中的反例进行欠采样（undersampling）；对训练集中的正例进行过采样（oversampling）；阈值移动（threshold-moving）。

问题

$E_{(w, b)}$ 为什么是关于 $w$ 和 $b$ 的凸函数？为什么关于 $w$ 和 $b$ 的导数均为零时，得到 $w$ 和 $b$ 的最优解？

$E_{(w, b)}$ 若为一般的二元函数，可由定义判定凹凸性；若为可微函数，可由两充要条件判断。

充要条件1（一阶条件）：设 $R_c$ 为 $E_n$ 上的开凸集， $f (X)$ 在 $R_c$ 上可微，则 $f (X)$ 为 $R_c$ 上的凸函数的充要条件是：对任意不同两点 $X^{(1)} \in R_c$ 和 $X^{(2)} \in R_c$ ，恒有 $f(X^{(2)}) \geq f(X^{(1)})+\nabla f\left(X^{(1)} \right) ^{T}(X^{(2)}=X^{(1)})$ 。