机器学习_西瓜书_C3线性模型_待更新

这篇博客详细介绍了机器学习中的线性模型,包括一元和多元线性回归、对数线性回归、对数几率回归(逻辑回归)、线性判别分析以及多分类学习策略如一对一、一对多和多对多。还探讨了类别不平衡问题及其解决方法,如欠采样、过采样和阈值移动。作者分享了学习过程中的挑战,特别是理解和应用数学公式。
摘要由CSDN通过智能技术生成

目录

3.1 基本形式

3.2 线性回归 linear regression

一元线性回归

多元线性回归

方法一: 最小二乘法(均方误差 square loss)

方法二: 极大似然法maximum likelihood method

对数线性回归log-linear regression

3.3 对数几率回归 logistic regression

3.4 线性判别分析(LDA)Linear Discriminant Analysis

3.5 多分类学习

一对一OvO

一对多OvR

多对多MvM

3.6 类别不平衡class imbalance

原因

策略

方法


3.1 基本形式

3.2 线性回归 linear regression

 离散属性: 若属性值存在序order关系, 可将离散值(高,矮)转为连续值(1,0); 若无序关系, 可转为k维向量(二分类化)

一元线性回归

多元线性回归

非满秩矩阵正则化regularization

确定w, b

方法一: 最小二乘法(均方误差 square loss)

 闭式解closed-form

方法二: 极大似然法maximum likelihood method

 

对数线性回归log-linear regression

广义线性模型generalized linear model在联系函数link function g() = ln() 时的特例

机器学习三要素:

  1. 模型:根据具体问题,确定假设空间
  2. 策略:根据评价标准,确定选取最优模型的策略(通常会产出一个“损失函数”)
  3. 算法:求解损失函数,确定最优模型

3.3 对数几率回归 logistic regression

针对二分类任务, 将实值z转为0/1, 单位阶跃函数unit-step function

sigmoid function

优点

  • 直接建模,无需假设分布;
  • 不仅预测类别,还可预测近似概率辅助决策;
  • 任意阶可导的凸函数,可直接求取最优解


3.4 线性判别分析(LDA)Linear Discriminant Analysis

3.5 多分类学习

拆分策略

一对一OvO

两个数据集的n个类别两两配对, N(N-1)/2 个二分类结果, 预测结果最多的类别作为最终结果. 存储/测试时间成本高, 训练时间成本低.

一对多OvR

一个类T, 其他类F, 考虑置信度, 选置信度最大的类别作为最终结果. 

多对多MvM

非随意取, 使用纠错输出码(ECOC)error correcting output codes, N个类别M次划分T/F, 比较预测/实际编码, 取距离最小的作为最终结果

3.6 类别不平衡class imbalance

原因

不同类别中样例数量差别大, 影响学习预测效果

策略

再缩放rescaling, ∵假设"训练集是真实样本总体的无偏采样"不成立

方法

  1. 欠采样under-sampling: 正少反多, 少采反. 时间成本低, 代表算法EasyEnsemble集成学习, 将反划分为若干个集合分别欠采
  2. 过采样over-sampling: 正少反多, 多采正. 时间成本高, 注意不能简单重复采样,代表算法SMOTE 用插值采样
  3. 阈值移动threshold-moving: 不增不减, 乘以观测几率cost+/cost-调整预测值

Task2 学习心得

  • 没看清任务内容, 两天时间把C3+C4都看了, C3内容多公式多, 一口气容易消化不良
  • 果然数学的尽头没有数字 = 我看不懂公式, 只能尽量用文字表达
  • 继续吐槽图+文的表述, 逻辑不清晰, 预剪枝反复看了几遍才理解, 又菜又气
  • 公式部分还需要重刷视频补充笔记
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值