西瓜书-第3章-线性模型

最新推荐文章于 2024-02-18 16:27:03 发布

路飞的纯白世界

最新推荐文章于 2024-02-18 16:27:03 发布

阅读量330

点赞数

分类专栏：机器学习西瓜书阅读笔记文章标签：线性回归 ECOC 类别不平衡

本文链接：https://blog.csdn.net/u010921136/article/details/90172153

版权

机器学习同时被 2 个专栏收录

19 篇文章 0 订阅

订阅专栏

西瓜书阅读笔记

8 篇文章 0 订阅

订阅专栏

0、广义线性模型

y=g^-1(w^Tx+b)
只需找一个单调可微函数即可真实标记与线性回归模型的预测值联系起来，就可得出多种狭义线性模型

1、基本形式

f(x)=w^Tx+b

2、对数线性回归

ln y=w^Tx+b

3、对数几率回归

ln (y/1-y)=w^Tx+b

4、线性判别分析（LDA），不搬推导过程了，这里知道S_b、S_w以及w的公式即可。

二分类问题上，通过投影，让同类的投影点尽可能接近，异类的尽可能远离；
若将数据投影到直线w上，则两类样本的中心在直线上的投影分别为w^Tu0和w^Tu1；
若将所有样本点投影在直线w上，则两类样本的协方差分别为w^TΣ0w和w^TΣ1w；
同类的投影点尽可能接近，可以让协方差尽可能小，即y₁=w^TΣ0w+w^TΣ1w尽可能小；
异类的投影点尽可能远离，可以让类中心之间的距离尽可能大，即y₂=||w^Tu0-w^Tu1||(2;2)尽可能大；
同时考虑二者：则目标J=y₂/y₁，则求得的目标尽可能大，意味着分子尽可能大，分母尽可能小。

定义“类内散度矩阵”：S_w=(x-u₀)(x-u₀)^T+(x-u₁)(x-u₁)^T
定义“类间散度矩阵”：S_b=(u₀-u₁)(u₀-u₁)^T

则J=w^TS_bw/w^TS_ww
这就是LDA欲最大化的目标，即S_w和S_b的广义瑞利商。

如何确定w呢？

w=S_w^-1（u₀-u₁）

当两类数据同先验、满足高斯分布且协方差相等时，LDA可达到最优分类。

5、多分类学习

有些二分类学习方法可直接推广到多分类，但在更多情况下，我们是基于一些基本策略，利用二分类学习器来解决多分类问题。比如：拆分策略。
最经典的拆分策略有三种：“一对一（OvO）”、“一对其余（OvR）”、“多对多（MvM）”

OvO：两两分别训练成分类器，从而产生N(N-1)/2个二分类任务，最终结果可通过投票产生：即把被预测最多的类别作为最终分类结果。
OvR：将每个类作为正例，其他类作为反类，从而产生N个分类器，若有多个分类器预测为正类，则通常考虑各分类器的预测置信度，选择置信度最大的类别标记作为分类结果。
MvM：有一种常用的MvM技术叫：“纠错输出码（ECOC）”；假设类别A分到了f1、f3、f4的正例，测试样例A1通过f1~f5的预测结果为（+、-、+、+、-）,则完全满足，即使错了一个，也比其他类如B类（分到了f1、f3）错两个更少，那也判定为A。