基于逻辑回归的二分类问题

最新推荐文章于 2024-07-27 10:38:25 发布

佐手jth

最新推荐文章于 2024-07-27 10:38:25 发布

阅读量4.3k

点赞数 2

文章标签：机器学习

本文链接：https://blog.csdn.net/qq_22063661/article/details/79133332

版权

基于逻辑回归的二分类问题

　　分类问题是机器学习的一个基础。一般地说，通过给定的特征集，给出对应的类别标签，即学习一个从 $\mathbb{R}^n\rightarrow\{0,1,\dots\}$ 的映射。我们将特征集记作 $X=\{x^{(1)},x^{(2)},\dots,x^{(m)}\}$ ，其中每一个样本代表一个n维向量；标签集记作 $y=\{0,1,\dots\}$ 。对于二分类问题， $y=\{0,1\}$ 。
　　逻辑回归的思想来自于线性回归。线性回归的目的是用n维空间的超平面来拟合具有线性相关性的一组数据，如下图所示。
　　线性回归举例
　　而对于分类问题，我们会考虑特征 $x$ 属于类别 $y$ 的概率 $P(y|x)$ 。它的概率分布函数如下：

P(y|x)={y^1−y^y=1y=0 P ( y | x ) = { y ^ y = 1 1 − y ^ y = 0 $P(y|x)=\begin{cases}\hat{y} &y=1\\ 1-\hat{y} &y=0 \end{cases}$
　　将这个函数写成一个统一的式子：

P(y|x)=y^y(1−y^)(1−y) P ( y | x ) = y ^ y ( 1 − y ^ ) ( 1 − y ) $P(y|x)=\hat{y}^y (1-\hat{y})^{(1-y)}$ 。为了处理的方便，对该式取对数，不改变函数的单调性：

a=ylogy^+(1−y)log(1−y^) a = y log ⁡ y ^ + ( 1 − y ) log ⁡ ( 1 − y ^ ) $a=y\log\hat{y}+(1-y)\log(1-\hat{y})$ 。我们的目标是调整参数最大化这个函数。
　　由于这里假设数据是线性可分的，则

y^=σ(wTx+b) y ^ = σ ( w T x + b ) $\hat{y}=\sigma{(w^Tx+b)}$ 。其中，

σ(z) σ ( z ) $\sigma(z)$ 称为sigmoid函数，目的是将大范围内的数据压缩回(0,1)这个区间范围。而这正好属于概率的范围。
　　在包含有m个训练样本的数据集上进行训练时，假设所有样本都是独立同分布的。这样，使用最大似然估计，取似然函数为

L(w,b)=∑i=1my(i)logy^(i)+(1−y(i))log(1−y^(i)) L ( w , b ) = ∑ i = 1 m y ( i ) log ⁡ y ^ ( i ) + ( 1 − y ( i ) ) log ⁡ ( 1 − y ^ ( i ) ) $L(w,b)=\sum\limits_{i=1}^{m}y^{(i)}\log\hat{y}^{(i)}+(1-y^{(i)})\log(1-\hat{y}^{(i)})$ 。其中使用

(i) ( i ) $(i)$ 上标表示第

i i $i$ 个样本
　　在机器学习中最常用的优化算法是梯度下降法。它通过调整参数使得当前误差向着局部误差最小点最快的方向调整。为了适应梯度下降的需要，我们对上述的似然函数求相反数并缩放

m

$m$ 背，从而使用梯度下降求出取的最小值时的参数

w w $w$ 和

b

$b$ ：

J(w,b)=−1m∑i=1m[y(i)logy^(i)+(1−y(i))log(1−y^(i))] J ( w , b ) = − 1 m ∑ i = 1 m [ y ( i ) log ⁡ y ^ ( i ) + ( 1 − y ( i ) ) log ⁡ ( 1 − y ^ ( i ) ) ] $J(w,b)=-\frac{1}{m}\sum\limits_{i=1}^{m}[y^{(i)}\log\hat{y}^{(i)}+(1-y^{(i)})\log(1-\hat{y}^{(i)})]$ 。
　

训练

　　使用梯度下降对逻辑回归的参数优化步骤如下所示：

random initialize w,b
repeat:
　　 $w_j -= \alpha \times \frac{\partial}{\partial{w_j}}J(w,b)$
　　 $b -= \alpha \times \frac{\partial}{\partial{b}}J(w,b)$
end repeat

　　其中,
　　 $\frac{\partial}{\partial{w_j}}J(w,b)=\frac{1}{m}\sum\limits_{i=1}^{m}(a^{(i)}-y^{(i)})x_j^{(i)}$
　　 $\frac{\partial}{\partial{b}}J(w,b)=\frac{1}{m}\sum\limits_{i=1}^{m}(a^{(i)}-y^{(i)})$
　　由于这里的算法使用了多重的循环，会导致算法的效率低下。在Python中，使用了单指令多数据(SIMD)的技术，可以大大地加快算法的执行速度。
　　

random initialize $w,b$
repeat:
　　 $z = w^TX+b$
　　 $a = \sigma(z)$
　　 $dz=a-y$
　　 $dw=X(dz)^T/m$
　　 $db=\sum{dz}/m$
　　 $w-=\alpha dw$
　　 $b-=\alpha db$

　　以下是python实现的一个简单的逻辑回归算法：
　　

import numpy as np
from numpy import loadtxt,where
import matplotlib.pyplot as plt

def sigmoid(z):
    return 1/(1+np.exp(-z))

def logistic_regression(X,y, lr=0.1, repeat=2000):
    w = np.zeros((X.shape[0],1))
    b = 0
    for i in range(repeat):
        z = np.dot(w.T, X) + b
        a = sigmoid(z)
        dz = a - y
        dw = np.dot(X, dz.T) / X.shape[1]
        db = np.sum(dz) / X.shape[1]
        w -= lr * dw
        b -= lr * db
    return w, b

if __name__ == '__main__':
    data = loadtxt('data1.txt', delimiter=',')
    X = data[:,0:2]
    y = data[:,2]#.reshape(1,X.shape[1])
    pos = where(y == 1)  
    neg = where(y == 0) 
    plt.scatter(X[pos, 0], X[pos, 1], marker='o', c='b')
    plt.scatter(X[neg, 0], X[neg, 1], marker='x', c='r')


    w,b = logistic_regression(X.T,y.T,lr=0.001, repeat=200000)
    print(w,b)

    k1 = -w[0][0]/w[1][0]
    k2 = -b / w[1][0]
    xx = np.arange(20,110,1)
    yy = k1 * xx + k2
    plt.plot(xx,yy)
    plt.show()

　　以上代码的运行结果如下：
　　

w= [[ 0.06550395]
 [ 0.05898701]]
b= -7.45017821751

　　这里写图片描述
　　感谢寒小阳大大提供的数据集，大家可以在这个链接下载数据集进行训练。

佐手jth

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫