sklearn学习-逻辑回归

最新推荐文章于 2023-02-09 09:23:03 发布

育林

最新推荐文章于 2023-02-09 09:23:03 发布

阅读量153

点赞数

文章标签：逻辑回归 sklearn 学习

本文链接：https://blog.csdn.net/weixin_42856170/article/details/128769128

版权

文章目录

一、逻辑回归概述
二、L1和L2的区别
三、逻辑回归中的特征工程
四、梯度下降：重要参数max_iter
总结

一、逻辑回归概述

面试高危问题：Sigmoid函数的公式和性质
Sigmoid函数是一个S型的函数，当自变量z趋近正无穷时，因变量g(z)趋近于1，而当z趋近负无穷时，g(z)趋近于0，它能够将任何实数映射到(0,1)区间，使其可用于将任意值函数转换为更适合二分类的函数。因为这个性质，Sigmoid函数也被当作是归一化的一种方法，与我们之前学过的MinMaxSclaer同理，是属于数据预处理中的“缩放”功能，可以将数据压缩到[0,1]之内。区别在于，MinMaxScaler归一化之后，是可以取到0和1的（最大值归一化后就是1，最小值归一化后就是0），但Sigmoid函数只是无限趋近于0和1。
在这里插入图片描述

我们已经了解了逻辑回归的本质，它是一个返回对数几率的，在线性数据上表现优异的分类器，它主要被应用在金融领域。其数学目的是求解能够让模型对数据拟合程度最高的参数的值，以此构建预测函数，然后将特征矩阵输入预测函数来计算出逻辑回归的结果y。注意，虽然我们熟悉的逻辑回归通常被用于处理二分类问题，但逻辑回归也可以做多分类。

二、L1和L2的区别

在这里插入图片描述

三、逻辑回归中的特征工程

在这里插入图片描述

四、梯度下降：重要参数max_iter

在这里插入图片描述
核心误区：到底在哪个函数上，求什么的偏导数？
一个多元函数的梯度，是对其自变量求偏导的结果，不是对其参数求偏导的结果。但是在逻辑回归的数学过程中，损失函数的自变量刚好是逻辑回归的预测函数y(x)的参数，所以才造成了这种让人误解的，“对多元函数的参数求偏导”的写法。务必记住，正确的做法是：在多元函数(损失函数)上对自变量(逻辑回归的预测函数y(x)的参数)求偏导，求解梯度的方式，和逻辑回归本身的预测函数y(x)没有一丝联系。
在这里插入图片描述

核心误区：步长到底是什么？
步长不是任何物理距离，它甚至不是梯度下降过程中任何距离的直接变化，它是梯度向量的大小上的一个比例，影响着参数向量每次迭代后改变的部分。
但是在我们开始梯度下降之前，我们并不知道什么样的步长才合适，但梯度下降一定要在某个时候停止才可以，否则模型可能会无限地迭代下去。因此，在sklearn当中，我们设置参数max_iter最大迭代次数来代替步长，帮助我们控制模型的迭代速度并适时地让模型停下。max_iter越大，代表步长越小，模型迭代时间越长，反之，则代表步长设置很大，模型迭代时间很短。迭代结束，获取到损失函数的最小值后，我们就可以找出这个最小值对应的参数向量，逻辑回归的预测函数也就可以根据这个参数向量来建立了。
在这里插入图片描述