Python与logistic回归——理解与实践

本文通过实例介绍了Python中的Logistic回归,适用于二分类问题的概率估计。讲解了logistic函数、损失函数、梯度下降法以及算法实现,并通过马疝气病数据集进行实践,展示了算法在数据预处理和预测中的应用。
摘要由CSDN通过智能技术生成

文章参考 https://www.cnblogs.com/chamie/p/4876149.html 【Machine Learning in Action --5】逻辑回归(LogisticRegression)从疝气病预测病马的死亡率

文章实例为疝气症预测病马死亡率,实例数据:http://archive.ics.uci.edu/ml/datasets/Horse+Colic


引言

logistic回归,一种广义的线性回归分析模型。常用于做二分类问题(非0即1),但是logsitic回归并不是分类器,是一种概率估计,下文中会做详细解释。


问题提出 

给定 m 个个体 (x^{(i)},y^{(i)}),对每一组个体求预测值 \theta ^{(i)},使得 \theta^{(i)} \approx y^{(i)} 其中 x^{(i)} 为 n 维列向量,x^{(i)} 中每一个元素都是个体特征,总共 n 个特征,y^{(i)} 取值为0或1。

即是 Given\{(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),\cdots,(x^{(m)},y^{(m)})\}Want\ \theta ^{(i)}\approx y^{(i)}

对于文章的实例,就是给出300组数据(300个个体),每组数据的 x^{(i)} 为病马的一些特征,例如年龄,呼吸频率等,y^{(i)} 即是病马死亡(0)或病马存活(1)。


logistic函数

上述问题可用拟合的方法进行求解,由于是二分类问题,简单的线性回归 \theta =w^{T}x+b 无法满足我们的需求(线性回归的值域为(-\infty,\infty)),那么引出了sigmoid函数

sigmoid函数 \sigma (x),也称作logistic函数,特殊地 \sigma (0) = 0.5

\sigma (x)=\frac{1}{1+e^{-x}}\ ,\ x\epsilon (-\infty,\infty)\ ,\ \sigma (x)\epsilon (0,1)

图像如图所示,简单可以看出sigmoid函数可以将线性回归 \theta =w^{T}x+b 映射到 (0,1) 区间,问题并没有解决,

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值