逻辑回归(对数几率回归)Logistic Regression

这篇博客详细介绍了逻辑回归的基本概念,包括样本特征、决策边界、假设函数、损失函数和梯度下降。通过实例展示了如何处理二分类问题,讨论了欠拟合和过拟合,提出正则化作为解决方案。最后,给出了具体问题的处理过程,包括数据预处理、函数实现及预测结果。
摘要由CSDN通过智能技术生成


前言

逻辑回归方法用来处理分类问题(classification)。

分类问题(classification)的输出是离散值,比如二分类(binary classification)–输出True或者False。这里主要利用二分类来说明逻辑回归方法。


一、引入知识

1.样本特征(feature)

样本特征为影响预测目标y的关键,也即为y的属性。

比如预测房价,特征可以取房子面积大小、房子所处楼层、房子建成年数等等。
假设样本有多个特征,特征数为n,即为 x 1   x 2   . . .   x n x_{1}~x_{2}~...~x_{n} x1 x2 ... xn

2.决策边界(Decision Boundary)

决策边界是能够把样本正确分类的一条边界。

类似线性回归中的假设函数(hypothesis function),可以定义正样本为边界内的样本,负样本为边界外的样本,具体取决于具体问题。

假设决策边界为
w 1 x 1 + w 2 x 2 + . . . + w n x n + b = 0 w_{1}x_{1}+w_{2}x_{2}+...+w_{n}x_{n}+b=0 w1x1+w2x2+...+wnxn+b=0
其中, w w w b b b 为待求参数(parameters),故决策边界是由参数来决定的,后面的操作就是为了求得参数的优解。

决策边界也可为非线性多项式。这里采用线性决策边界来说明。

3.假设函数(hypothesis function)

根据决策边界,假设函数为
z ( x ) = w 1 x 1 + w 2 x 2 + . . . + w n x n + b z(x)=w_{1}x_{1}+w_{2}x_{2}+...+w_{n}x_{n}+b z(x)=w1x1+w2x2+...+wnxn+b
决策边界即为 z ( x ) = 0 z(x)=0 z(x)=0

设单个样本特征向量为 x ⃗ = [ x 1 , x 2 , . . . , x n ] \vec{x}=[x_{1},x_{2},...,x_{n}] x =[x1,x2,...,xn],参数 w ⃗ = [ w 1 , w 2 , . . . , w n ] \vec{w}=[w_{1},w_{2},...,w_{n}] w =[w1,w2,...,wn]
故假设函数可写成 z ( x ) = w ⃗ ⋅ x ⃗ + b z(x)=\vec{w}·\vec{x}+b z(x)=w x +b

由于是处理二分类问题,即需要输出为0或1,故将输出再通过sigmoid函数处理,使其值介于0~1之间。sigmoid函数如下:
g ( z ) = s i g m o i d ( z ) = 1 1 + e − z g(z)=sigmoid(z)=\frac{1}{1+e^{-z}} g(z)=sigmoid(z)=1+ez1
其图像如下:
sigmoid

由函数图像可以看出,
z = 0 z=0 z=0 时, y = 0.5 y=0.5 y=0.5,即对应为决策边界;
z > 0 z>0 z>0时, 0.5 < y < 1 0.5<y<1 0.5<y<1,决策边界的一边为正(负)样本;
z < 0 z<0 z<0 时, 0 < y < 0.5 0<y<0.5 0<y<0.5,决策边界的另一边为负(正)样本。
故可规定当 y > = 0.5 y>=0.5 y>=0.5,输出为1;当 y < 0.5 y<0.5 y<0.5,输出为0。
这样即可完成二分类输出。

用概率统计来描述,相当于0-1分布,即
P ( y = 1 ∣ z ) = s i g m o i d ( z ) = 1 1 + e − z = e z 1 + e z P(y=1|z)=sigmoid(z)=\frac{1}{1+e^{-z}}=\frac{e^{z}}{1+e^{z}} P(y=1∣z)=sigmoid(z)=1+ez1=1+ez

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值