吃瓜教程2|线性模型

最新推荐文章于 2024-07-14 21:21:42 发布

fof920

最新推荐文章于 2024-07-14 21:21:42 发布

阅读量289

点赞数

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44529258/article/details/133999777

版权

线性回归

“广义的线性模型”（generalized linear model），其中，g（*）称为联系函数（link function）。

线性几率回归（逻辑回归）

线性判别分析

想让同类样本点的投影点尽可能接近，不同类样本点投影之间尽可能远，即：让各类的协方差之和尽可能小，不用类之间中心的距离尽可能大。基于这样的考虑，LDA定义了两个散度矩阵。

类内散度矩阵（within-class scatter matrix）

Image Name

类间散度矩阵(between-class scaltter matrix)

Image Name

因此得到了LDA的最大化目标：“广义瑞利商”（generalized Rayleigh quotient）。

Image Name

从而分类问题转化为最优化求解w的问题，当求解出w后，对新的样本进行分类时，只需将该样本点投影到这条直线上，根据与各个类别的中心值进行比较，从而判定出新样本与哪个类别距离最近。求解w的方法如下所示，使用的方法为λ乘子。

Image Name

若将w看做一个投影矩阵，类似PCA的思想，则LDA可将样本投影到N-1维空间（N为类簇数），投影的过程使用了类别信息（标记信息），因此LDA也常被视为一种经典的监督降维技术。

类别不平衡问题

类别不平衡（class-imbanlance）就是指分类问题中不同类别的训练样本相差悬殊的情况，例如正例有900个，而反例只有100个，这个时候我们就需要进行相应的处理来平衡这个问题。常见的做法有三种：

在训练样本较多的类别中进行“欠采样”（undersampling）,比如从正例中采出100个，常见的算法有：EasyEnsemble。
在训练样本较少的类别中进行“过采样”（oversampling）,例如通过对反例中的数据进行插值，来产生额外的反例，常见的算法有SMOTE。
直接基于原数据集进行学习，对预测值进行“再缩放”处理。其中再缩放也是代价敏感学习的基础。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吃瓜教程2|线性模型

从而分类问题转化为最优化求解w的问题，当求解出w后，对新的样本进行分类时，只需将该样本点投影到这条直线上，根据与各个类别的中心值进行比较，从而判定出新样本与哪个类别距离最近。若将w看做一个投影矩阵，类似PCA的思想，则LDA可将样本投影到N-1维空间（N为类簇数），投影的过程使用了类别信息（标记信息），因此LDA也常被视为一种经典的监督降维技术。想让同类样本点的投影点尽可能接近，不同类样本点投影之间尽可能远，即：让各类的协方差之和尽可能小，不用类之间中心的距离尽可能大。
复制链接

扫一扫

fof920 CSDN认证博客专家 CSDN认证企业博客

码龄6年

66: 原创

113万+: 周排名

8万+: 总排名

1万+: 访问

: 等级

669: 积分

10: 粉丝

9: 获赞

23: 评论

22: 收藏

私信

关注

热门文章

最新评论

代码随想录day60|84. 柱状图中最大的矩形
fof920: 其实找的是左右两边比他小的柱子，左边再st[-2]，自己st[-1]，右边当前i
代码随想录训练营day3|203. 移除链表元素707. 设计链表206. 反转链表
fof920: 反转链表重要的是思路，不断用双指针右连左然后向右移，最开始用None，而不是dummy_node
代码随想录训练营day3|203. 移除链表元素707. 设计链表206. 反转链表
fof920: 设计链表需要仔细一点，也需要dummy_node，不然太麻烦
代码随想录训练营day3|203. 移除链表元素707. 设计链表206. 反转链表
fof920: 对于链表题目，尽可能还是用双指针，只用cur容易乱，另外dummy_node主要是处理head元素的问题，请注意，另外就是在删除时要注意cur是否往下移
代码随想录day59|503. 下一个更大元素 II42. 接雨水
fof920: 下一个更大元素2和之前的基本是类似的，只是可以循环，处理循环就将数组进行重复即可

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。