R语言数据分析系列之九 - 逻辑回归

最新推荐文章于 2024-05-03 16:33:51 发布

康派尔

最新推荐文章于 2024-05-03 16:33:51 发布

阅读量4w

点赞数 8

分类专栏：机器学习数据挖掘 R 文章标签： r语言数据挖掘数据分析

本文链接：https://blog.csdn.net/comaple/article/details/45062489

版权

数据挖掘同时被 3 个专栏收录

11 篇文章 1 订阅

订阅专栏

9 篇文章 3 订阅

订阅专栏

机器学习

8 篇文章 0 订阅

订阅专栏

R语言数据分析系列之九

—— by comaple.zhang

本节将一下逻辑回归和R语言实现，逻辑回归(LR，LogisticRegression)其实属于广义回归模型，根据因变量的类型和服从的分布可以分为，普通多元线性回归模型，和逻辑回归，逻辑回归是指因变量是离散并且取值范围为{0，1}两类，如果离散变量取值是多项即变为 multi-class classification，所以LR模型是一个二分类模型，可以用来做CTR预测等。那么我们现在来引出逻辑回归如何做二分类问题。

问题引入

在多元线性回归中我们的模型公式是这样子的（参考前两节内容），

这里的f(x,w)是连续的变量，如果我们的因变量是离散的如何处理呢，比如我们得数据是这样子的。

x <- seq(-3,3,by=0.01)

y <- 1/(1+exp(-x))

gdf <- data.frame(x=x,y=y)

ggplot(gdf,aes(x=x,y=x+0.5)) +geom_line(col='green')

这样显然无法拟合我们{0，1}输出，为了能够拟合离散的{0，1}输出我们引入sigmoid函数如下：

ggplot(gdf,aes(x=x,y=y))+geom_line(col='blue')+ geom_vline(xintercept=c(0),col='red') + geom_hline(yintercept=c(0,1),lty=2)

用R将该函数的图行画出来如下图：

又来这个函数我们可以很方便的将线性关系转换为离散的{0，1}输出

ggplot(gdf,aes(x=x,y=y))+geom_line(col='blue')+ geom_vline(xintercept=c(0),col='red') + geom_hline(yintercept=c(0,1),lty=2) +geom_line(aes(x=x,y=x+0.5),col='green')