机器学习_西瓜书_C3线性模型_待更新

大老猪

已于 2022-07-21 09:56:08 修改

阅读量350

收藏

点赞数

分类专栏：机器学习文章标签：机器学习

于 2022-07-14 21:32:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/d1596324/article/details/125759706

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

这篇博客详细介绍了机器学习中的线性模型，包括一元和多元线性回归、对数线性回归、对数几率回归（逻辑回归）、线性判别分析以及多分类学习策略如一对一、一对多和多对多。还探讨了类别不平衡问题及其解决方法，如欠采样、过采样和阈值移动。作者分享了学习过程中的挑战，特别是理解和应用数学公式。

摘要由CSDN通过智能技术生成

目录

3.1 基本形式

3.2 线性回归 linear regression

一元线性回归

多元线性回归

方法一: 最小二乘法(均方误差 square loss)

方法二: 极大似然法maximum likelihood method

对数线性回归log-linear regression

3.3 对数几率回归 logistic regression

3.4 线性判别分析(LDA)Linear Discriminant Analysis

3.5 多分类学习

一对一OvO

一对多OvR

多对多MvM

3.6 类别不平衡class imbalance

原因

策略

方法

3.1 基本形式

3.2 线性回归 linear regression

离散属性: 若属性值存在序order关系, 可将离散值(高,矮)转为连续值(1,0); 若无序关系, 可转为k维向量(二分类化)

一元线性回归

多元线性回归

非满秩矩阵正则化regularization

确定w, b

方法一: 最小二乘法(均方误差 square loss)

闭式解closed-form

方法二: 极大似然法maximum likelihood method

对数线性回归log-linear regression

广义线性模型generalized linear model在联系函数link function g() = ln() 时的特例

机器学习三要素：

模型：根据具体问题，确定假设空间
策略：根据评价标准，确定选取最优模型的策略（通常会产出一个“损失函数”）
算法：求解损失函数，确定最优模型

3.3 对数几率回归 logistic regression

针对二分类任务, 将实值z转为0/1, 单位阶跃函数unit-step function

sigmoid function

优点

直接建模,无需假设分布;
不仅预测类别,还可预测近似概率辅助决策;
任意阶可导的凸函数,可直接求取最优解

3.4 线性判别分析(LDA)Linear Discriminant Analysis

3.5 多分类学习

拆分策略

一对一OvO

两个数据集的n个类别两两配对, N(N-1)/2 个二分类结果, 预测结果最多的类别作为最终结果. 存储/测试时间成本高, 训练时间成本低.

一对多OvR

一个类T, 其他类F, 考虑置信度, 选置信度最大的类别作为最终结果.

多对多MvM

非随意取, 使用纠错输出码(ECOC)error correcting output codes, N个类别M次划分T/F, 比较预测/实际编码, 取距离最小的作为最终结果

3.6 类别不平衡class imbalance

原因

不同类别中样例数量差别大, 影响学习预测效果

策略

再缩放rescaling, ∵假设"训练集是真实样本总体的无偏采样"不成立

方法

欠采样under-sampling: 正少反多, 少采反. 时间成本低, 代表算法EasyEnsemble集成学习, 将反划分为若干个集合分别欠采
过采样over-sampling: 正少反多, 多采正. 时间成本高, 注意不能简单重复采样,代表算法SMOTE 用插值采样
阈值移动threshold-moving: 不增不减, 乘以观测几率cost+/cost-调整预测值

Task2 学习心得

没看清任务内容, 两天时间把C3+C4都看了, C3内容多公式多, 一口气容易消化不良
果然数学的尽头没有数字 = 我看不懂公式, 只能尽量用文字表达
继续吐槽图+文的表述, 逻辑不清晰, 预剪枝反复看了几遍才理解, 又菜又气
公式部分还需要重刷视频补充笔记

大老猪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值