逻辑回归算法梳理

最新推荐文章于 2024-05-27 23:07:35 发布

yxyibb

最新推荐文章于 2024-05-27 23:07:35 发布

阅读量447

点赞数

分类专栏：算法梳理文章标签：一周算法梳理

本文链接：https://blog.csdn.net/u012835414/article/details/85949612

版权

算法梳理专栏收录该内容

23 篇文章 0 订阅

订阅专栏

1、逻辑回归与线性回归的联系与区别

联系:逻辑回归是广义的线性回归

区别：

1、线性回归一般解决回归问题。逻辑回归一般解决分类问题，是最基本的分类算法。

2、线性回归的参数计算方法是最小二乘法，逻辑回归的参数计算方法是梯度下降。

3、线性回归是拟合函数，逻辑回归是预测函数

4、正则化与模型评估指标

正则化：

许多任务中，会遇到大量变量。当变量数多余样例数数时，可接触多个参数指，均可使均方误差最小化。选择哪个解作为最终输出，讲由学习算法的归纳偏好决定。常见的做法是引入正则化项。

正则化项将参数估计朝零的方向进行约束、调整或缩小。也就是说，正则化可以在学习过程中降低模型复杂度和不稳定程度，从而避免过拟合的危险。常用的是L1、L2正则化。

其中，加入正则化项的逻辑回归损失为：

评估指标：

逻辑回归属于分类问题，在此总结分类问题的模型评估指标：

5、逻辑回归的优缺点

优点：

训练速度快。
分类器简单，可解释性好。
通过权重容易分析特征贡献。

缺点：

分类精度不高。
依赖特征。

6、样本不均衡问题解决办法

采样（上采样+下采样）
合成数据（采用已知样本，人为生成更多样本）
样本加权（不同类别分错代价不同）

(penalty=’l2’, dual=False, tol=0.0001, C=1.0, fit_intercept=True,intercept_scaling=1, class_weight=None, random_state=None, solver=’liblinear’, max_iter=100, multi_class=’ovr’,verbose=0, warm_start=False, n_jobs=1)

penalty:’l1’ or ‘l2’ ,默认’l2’ #惩罚
dual:bool 默认False ‘双配方仅用于利用liblinear解算器的l2惩罚。’
tol: float, 默认: 1e-4 ‘公差停止标准’
C:float 默认:1.0 正则化强度，与支持向量机一样，较小的值指定更强的正则化。
fit_intercept: bool 默认:True 指定是否应将常量（a.k.a. bias或intercept）添加到决策函数中。
intercept_scaling:float ,默认:1 仅在使用求解器“liblinear”且self.fit_intercept设置为True时有用。在这种情况下，x变为[x，self.intercept_scaling]，即具有等于intercept_scaling的常数值的“合成”特征被附加到实例矢量。截距变为intercept_scaling * synthetic_feature_weight
class_weight: dict or ‘balanced’ 默认:None
与{class_label：weight}形式的类相关联的权重。如果没有给出，所有类都应该有一个权重。“平衡”模式使用y的值自动调整与输入数据中的类频率成反比的权重，如n_samples /（n_classes * np.bincount（y））。请注意，如果指定了sample_weight，这些权重将与sample_weight（通过fit方法传递）相乘。
random_state:int,RandomState实例或None，可选，默认值：None
在随机数据混洗时使用的伪随机数生成器的种子。如果是int，则random_state是随机数生成器使用的种子; 如果是RandomState实例，则random_state是随机数生成器; 如果为None，则随机数生成器是np.random使用的RandomState实例。在求解器=='sag'或'liblinear'时使用。
solver:{‘newton-cg’,’lbfgs’,’liblinear’,’sag’,’saga’}
默认: ‘liblinear’ 在优化问题中使用的算法。
对于小型数据集，'liblinear'是一个不错的选择，而'sag'和'saga'对于大型的更快。
对于多类问题，只有'newton-cg'，'sag'，'saga'和'lbfgs'处理多项损失; 'liblinear'仅限于’ovr’方案。'newton-cg'，'lbfgs'和'sag'只处理L2惩罚，而'liblinear'和'saga'处理L1惩罚。请注意，“sag”和“saga”快速收敛仅在具有大致相同比例的要素上得到保证。您可以使用sklearn.preprocessing中的缩放器预处理数据。
max_iter: int 默认:100 仅适用于newton-cg，sag和lbfgs求解器。求解器收敛的最大迭代次数。
muti_class:str,{‘ovr’:’multinomial’},默认:’ovr’
多类选项可以是'ovr'或'multinomial'。如果选择的选项是'ovr'，那么二元问题适合每个标签。另外，最小化损失是整个概率分布中的多项式损失拟合。不适用于liblinear解算器。
verbose: int,默认:0 对于liblinear和lbfgs求解器，将verbose设置为任何正数以表示详细程度。
warm_start:bool 默认:False
设置为True时，重用上一次调用的解决方案以适合初始化，否则，只需擦除以前的解决方案。对于liblinear解算器没用。
版本0.17中的新功能：warm_start支持lbfgs，newton-cg，sag，saga求解器。
n_jobs: int,默认:1
如果multi_class ='ovr'“，则在对类进行并行化时使用的CPU核心数。无论是否指定'multi_class'，当``solver``设置为'liblinear'时，都会忽略此参数。如果给定值-1，则使用所有核心。

参考

https://blog.csdn.net/hy13684802853/article/details/80589182
https://www.jiqizhixin.com/articles/2017-11-23-4
https://blog.csdn.net/ustbclearwang/article/details/81235892

yxyibb

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归算法梳理

目录1、逻辑回归与线性回归的联系与区别2、逻辑回归的原理3、逻辑回归损失函数推导及优化4、正则化与模型评估指标5、逻辑回归的优缺点6、样本不均衡问题解决办法7. sklearn参数1、逻辑回归与线性回归的联系与区别联系:逻辑回归是广义的线性回归区别：1、线性回归一般解决回归问题。逻辑回归一般解决分类问题，是最基本的分类算法。2、线性回归的参数计算...
复制链接

扫一扫