逻辑回归（Logistic Regression）

最新推荐文章于 2024-03-24 20:00:54 发布

qq_45140640

最新推荐文章于 2024-03-24 20:00:54 发布

阅读量604

点赞数

本文链接：https://blog.csdn.net/qq_45140640/article/details/91380355

版权

本文详细介绍了逻辑回归模型，特别是在处理分类问题中的应用。逻辑回归适用于因变量为二分类或多分类的场景，通过Sigmoid函数描述概率与自变量的非线性关系。文章探讨了LogisticRegression的正则化参数、分类方式选择、类型权重以及样本权重等关键参数，强调了在处理样本不平衡和模型选择时的策略。同时，解释了不同的优化算法，如liblinear、lbfgs、newton-cg和sag的适用场景及其限制。

摘要由CSDN通过智能技术生成

一. 逻辑回归

在前面讲述的回归模型中，处理的因变量都是数值型区间变量，建立的模型描述是因变量的期望与自变量之间的线性关系。比如常见的线性回归模型：

而在采用回归模型分析实际问题中，所研究的变量往往不全是区间变量而是顺序变量或属性变量，比如二项分布问题。通过分析年龄、性别、体质指数、平均血压、疾病指数等指标，判断一个人是否换糖尿病，Y=0表示未患病，Y=1表示患病，这里的响应变量是一个两点（0-1）分布变量，它就不能用h函数连续的值来预测因变量Y（只能取0或1）。
总之，线性回归模型通常是处理因变量是连续变量的问题，如果因变量是定性变量，线性回归模型就不再适用了，需采用逻辑回归模型解决。

逻辑回归（Logistic Regression）是用于处理因变量为分类变量的回归问题，常见的是二分类或二项分布问题，也可以处理多分类问题，它实际上是属于一种分类方法。
二分类问题的概率与自变量之间的关系图形往往是一个S型曲线，如图所示，采用的Sigmoid函数实现。

PS:如果你觉得这篇文章看起来稍微还有些吃力，或者想要系统地学习人工智能，那么推荐你去看床长人工智能教程。非常棒的大神之作。教程不仅通俗易懂，而且很风趣幽默。点击这里可以查看教程。

这里我们将该函数定义如下：

函数的定义域为全体实数，值域在[0,1]之间，x轴在0点对应的结果为0.5。当x取值足够大的时候，可以看成0或1两类问题，大于0.5可以认为是1类问题，反之是0类问题，而刚好是0.5，则可以划分至0类或1类。对于0-1型变量，y=1的概率分布公式定义如下：

y=0的概率分布公式定义如下：

其离散型随机变量期望值公式如下：

采用线性模型进行分析，其公式变换如下：

而实际应用中，概率p与因变量往往是非线性的，为了解决该类问题，我们引入了logit变换，使得logit(p)与自变量之
间存在线性相关的关系，逻辑回归模型定义如下：

通过推导，概率p变换如下，这与Sigmoid函数相符，也体现了概率p与因变量之间的非线性关系。以0.5为界限，预

测p大于0.5时，我们判断此时y更可能为1，否则y为0。

得到所需的Sigmoid函数后，接下来只需要和前面的线性回归一样，拟合出该式中n个参数θ即可。test17_05.py为绘

制Sigmoid曲线，输出上图所示。


  
  
  
   
    
    
    
     
     
     
    
    
    
    
    
    
     
     
     
      
      
      import matplotlib.pyplot 
      
      
      as plt