scikit-learn：逻辑回归参数解释

最新推荐文章于 2024-08-19 19:51:08 发布

cy^2

最新推荐文章于 2024-08-19 19:51:08 发布

阅读量952

点赞数

分类专栏： scikit-learn 文章标签：逻辑回归 scikit-learn

本文链接：https://blog.csdn.net/qq_34120015/article/details/123999983

版权

scikit-learn 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1、Logistic regression 简单介绍

又称对数几率回归；首先，逻辑回归处理是分类问题，对于二分类则是将线性函数的输出结果通过sigmoid函数映射到0/1标签，即越靠近1则判别为正例的概率越大，并最终通过最大似然估计优化求解。

逻辑回归：模型构建、估计参数求解、结果解读笔记

2、逻辑回归评估器中的参数解释

LogisticRegression?

参数	解释
penalty	正则化项
dual	是否求解对偶问题*
tol	迭代停止条件：两轮迭代损失值差值小于tol时，停止迭代
C	经验风险和结构风险在损失函数中的权重
fit_intercept	线性方程中是否包含截距项
intercept_scaling	相当于此前讨论的特征最后一列全为1的列，当使用liblinear求解参数时用于捕获截距
class_weight	各类样本权重*
random_state	随机数种子
solver	损失函数求解方法*
max_iter	求解参数时最大迭代次数，迭代过程满足max_iter或tol其一即停止迭代
multi_class	多分类问题时求解方法*
verbose	是否输出任务进程
warm_start	是否使用上次训练结果作为本次运行初始参数
l1_ratio	当采用弹性网正则化时， $l 1$ 正则项权重，就是损失函数中的 $\rho$

dual：是否求解对偶问题

对偶问题是约束条件相反、求解方向也相反的问题，当数据集过小而特征较多时，求解对偶问题能一定程度降低运算复杂度，其他情况建议保留默认参数取值。

class_weight:各类样本权重

class_weight其实代表各类样本在进行损失函数计算时的数值权重，例如假设一个二分类问题，0、1两类的样本比例是2:1，此时可以输入一个字典类型对象用于说明两类样本在进行损失值计算时的权重，例如输入:{0:1, 1:3}，则代表1类样本的每一条数据在进行损失函数值的计算时都会在原始数值上*3。而当我们将该参数选为balanced时，则会自动将这个比例调整为真实样本比例的反比，以达到平衡的效果。