logistics regression原理与线性回归

这篇博客探讨了逻辑回归和线性回归在解决分类问题时的不同之处,特别是从模型、决策边界和代价函数的角度进行阐述。逻辑回归通过sigmoid函数将线性回归转化为概率估计,进而确定分类阈值。同时,介绍了逻辑回归的代价函数,强调了其非凸特性和梯度下降法在优化过程中的应用。此外,还提及了多分类问题的解决方案。
摘要由CSDN通过智能技术生成

逻辑回归

从分类问题思考:线性回归与逻辑回归

分类问题
0:Negative class
1:Positive Class
二分类问题开始
将已知数据分类 0 1
采用算法 线性回归
假设函数 hx = theta0 + theta1*x1 + ... + thetaN * xN
设置阈值---什么情况下属于1类 or 0类
        > 0.5 1
        < 0.5 0
所有的点 
对于分类问题应用线性回归并不是好办法

还有一个有趣的事情:
classification: 0 or 1
but 假设函数可以 大于1 or 小于0

接下来使用逻辑回归算法进行分类
logistic regression 逻辑回归
逻辑回归:实际上是一种分类算法

机器学习三要素 模型 策略 算法

逻辑回归假设函数 – 模型

logistic regression model
目标:
    将假设函数值限定在[0,1]之中
    如果 >= 0.5 属于 1类
    反之 属于0类
    want 0< hx < 1

逻辑回归的假设函数的表达式是什么?
逻辑回归的假设函数与线性回归的假设函数不同 
带入了越阶函数 sigmoid function
线性回归hx = theta^T*x
逻辑回归hx = g(theta^T*x)
逻辑回归 – 从线性回归假设函数逐步优化

假设函数 : hθ(x)=θTx h θ ( x ) = θ T x 逻辑回归的目标是分类 输出 0 or 1 引入 sigmoid function 即: hθ(x)=g(θTx) h θ ( x ) = g ( θ T x ) g(z)=11+ρ(z) g ( z ) = 1 1 + ρ ( − z ) 模型的解释 对于新输入样本x的y等于1的概率的估计值 即为: g(z)=11+ρ(θTx) g ( z ) = 1 1 + ρ ( − θ T x )

也可以用概率公式来解释
p(y=1|x;θ)=g(z) p ( y = 1 | x ; θ ) = g ( z )
p(y=0|x;θ)+p(y=1|x;θ)=1 p ( y = 0 | x ; θ ) + p ( y = 1 | x ; θ ) = 1
p(y=0|x;θ)=1p(y=1|x;θ) p ( y = 0 | x ; θ ) = 1 − p ( y = 1 | x ; θ )

总结: 
    逻辑回归的假设函数是什么
    定义逻辑回归的假设函数的公式是什么

逻辑回归模型假设函数的推导
这里写图片描述
如何从解释该模型 模型转化的思路
这里写图片描述

决策边界

决策边界:假设函数在计算什么
目标:预测分类问题
suppose predict “y=1” if hθ(x)>=0.5 h θ ( x ) >= 0.5
θTx>=0 θ T x >= 0
“y=0” if hθ(x)<0.5 h θ ( x ) < 0.5
θTx<0 θ T x < 0

hθ(x)=g(θTx)=p(y=1|x;θ) h θ ( x ) = g ( θ T x ) = p ( y = 1 | x ; θ )
g(z)

在临床预测中,单因素和多因素logistic回归可以用于预测患者的疾病风险或临床结果。以下是一个简单的示例,演示如何在R语言中进行临床预测的单因素和多因素logistic回归。 首先,确保你已经导入了你的临床数据集,并将其存储在一个称为`data`的数据框中。数据框应包含自变量(例如患者的年龄、性别、血压等)和二元响应变量(例如患者是否患有某种疾病)。 单因素logistic回归示例: ```R # 导入数据 data <- read.csv("clinical_data.csv") # 拟合单因素logistic回归模型 model <- glm(disease_status ~ age, data = data, family = binomial) # 打印模型摘要 summary(model) ``` 在上述代码中,`disease_status`是二元响应变量,`age`是自变量。你可以根据你的数据集修改自变量的选择。 多因素logistic回归示例: ```R # 拟合多因素logistic回归模型 model <- glm(disease_status ~ age + gender + blood_pressure, data = data, family = binomial) # 打印模型摘要 summary(model) ``` 在上述代码中,`age`、`gender`和`blood_pressure`是你选择的多个自变量。 通过拟合logistic回归模型,你可以得到自变量的系数估计、p值以及其他统计信息,以便评估它们对疾病预测的贡献。 请记住,这只是一个简单的示例,实际情况中可能需要考虑更多因素,如变量筛选、模型评估和验证等。如果你有更具体的问题或需要更多的帮助,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值