DataWhale X 南瓜书学习笔记 task03笔记

对数几率回归

  • 使用场景:分类任务。
  • 根据广义线性模型,分类任务构建模型的基本思想:找到一个单调可微函数将分类任务的真实标记(值)与线性回归模型的预测值联系起来。

    对数几率回归的引入

二分类任务

  • 输出标记:y\in{0,1}
  • 线性模型产生的预测值(实数值)=>二分类任务的输出标记,我们需要单位阶跃函数
  • 单位阶跃函数如下:

 从图3.2可看出,单位阶跃函数不连续,而广义线性模型中的g(.)是连续函数,如果要构建线性模型,单位阶跃函数肯定是不行的,但是我们又特别需要单位阶跃函数的特性,故而找到了对数几率函数。


对数几率函数的正篇

  • 对数几率函数的原始形式:
  • 对数几率函数的特性:
  1. 将z值=>接近0/1的y值
  2. y值在z=0附近变化很陡
  3. 任意阶可导的凸函数
  • 对数几率函数作为g(.)代入广义线性函数:

  • (3.18 )式变成严格的线性函数形式:

我们可视为样本x作为正例的可能性,则1-y是其反例可能性,2者的比值:

(3.20)式称为”几率“,再取对就是(3.19)的左式。

确定(3.18)中的w和b:

 若将式(3.18)中的y视为类后验概率估计p(y = 1| x),则式(3.19)可重写为:

通过”极大似然法“估计w和b: 

在对率回归模型最大化“对数似然”如下:

由(3.25)式,我们可知令每个样本属于其真实标记的概率越大越好。

为了便于讨论,令\beta=(w:b),

  • 对数几率函数的优点:
  1. 直接对分类可能性进行建模,无需事先假设数据分布。
  2. 不仅是预测出”类别“,而且是得到近似概率预测,对利用概率辅助决策的任务很有用。

南瓜(《统计学习方法》)是一本机器学习领域的经典教材,被称为机器学习领域的“圣经”。这本由李航教授撰写,包含了机器学习的基本概念、方法和算法等内容。 南瓜主要分为三个部分。第一部分是关于机器学习基础的内容,包括统计学习方法的基本概念、模型评估和选择等内容。第二部分介绍了常用的机器学习算法,如线性模型、决策树、支持向量机等,以及集成学习和聚类方法。第三部分则深入探讨了机器学习中的优化方法、神经网络和深度学习等内容。 该以清晰的逻辑结构和严谨的数学推导,为读者提供了一个系统了解机器学习的方法。同时,该注重实践应用,给出了大量的示例和案例分析,帮助读者理解算法的实际应用场景。 南瓜因其全面而详细的内容,以及对数学推导和算法实现的深入讲解而受到广大学习者的喜爱。对于机器学习初学者来说,这本可以作为入门教材,帮助他们建立起对机器学习基础概念和方法的全面认识。对于已经具备一定机器学习基础的学习者来说,该是一个不可或缺的参考资料,可以帮助他们进一步深入理解和应用机器学习算法。 南瓜的电子版PDF在互联网上广为流传,读者可以通过下载或在线阅读的方式获取。通过阅读南瓜,我们可以更好地掌握机器学习的基本原理和实践技巧,为进一步深入研究和应用机器学习打下坚实的基础。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值