【ML笔记】第三章 线性模型

本文详细介绍了线性模型的基本形式,包括线性回归、对数几率回归和线性判别分析(LDA)。线性回归通过最小二乘法求解模型参数,对数几率回归用于分类任务,而LDA则寻找最优分类边界。此外,还讨论了多分类学习策略如一对一和一对余,并提出了解决类别不平衡问题的方法,如阈值校正、欠采样和过采样。
摘要由CSDN通过智能技术生成

第3章 线性模型

基本形式

给各个属性分配权值,和数对应到预测函数

线性回归

  • 定义:给定离散的数据点(属性,标记)数据对,学习线性模型预测输出
  • 对于输入属性
    • 输入属性数目只有一个
      • 离散属性:存在序关系的转换为大小不同的值,不存在序关系的转化为0/1向量
  • 基于均方误差最小化进行模型求解的方法:「最小二乘法」
  • 求解w,b使得均方误差最小的过程称为最小二乘「参数估计」
    • 对均方误差函数E(w,b)分别关于w和b求导,令导数为0
    • 原理:E是关于w和b的凸函数;判断凸函数方法:二阶导数在区间上非负(若严格大于0则称严格凸函数)
  • 多元线性回归

对数几率回归

  • 将分类任务用线性模型解决
  • 「单位阶跃函数」:以0.5为界将0~1的实值转化为0/1标记(自变量只接收0/0.5/1三个离散值)
  • 「对数几率函数」:y=1/(1+e^-z) 是一种Sigmoid函数(形似S的函数)
    • 可以变形为ln(y/(1-y))=z
    • 左边称为「对数几率」,即几率的自然对数
    • 几率(odds)是正确可能性/错误可能性
  • 优点
    • 无须假设数据分布</
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值