机器学习（一）逻辑回归（损失函数、决策边界）

最新推荐文章于 2024-07-22 10:08:20 发布

懒得聪明..

最新推荐文章于 2024-07-22 10:08:20 发布

阅读量1.2k

点赞数 1

分类专栏：机器学习文章标签： python 机器学习逻辑回归算法

本文链接：https://blog.csdn.net/murphy852/article/details/107353753

版权

本文介绍了逻辑回归的基础知识，包括其用于分类问题的性质，Sigmoid函数的作用，以及逻辑回归的损失函数和梯度。文章还探讨了如何实现逻辑回归算法，并讨论了决策边界的确定和在多项式特征中的应用。最后提到了sklearn库中的逻辑回归实现，以及OvR和OvO策略在多分类问题中的应用。

摘要由CSDN通过智能技术生成

一、什么是逻辑回归

逻辑回归：解决分类问题，将样本的特征和样本发生的概率联系起来
逻辑回归的函数 $\hat{y} = f(x)$ ，对于线性回归来说，可变换为 $\hat{y} = θ^T \cdot{x_b}$ ， $\hat{y}$ 的值域为 $(-\infty,+\infty)$ ，但概率的值域为[0, 1]，因此需要寻找一个函数，使得 $\hat{p} = σ(θ^T \cdot{x_b})$ 的值在[0, 1]之间，由此引入了Sigmoid函数σ：
$\frac{1}{1+e^{-t}}$
为什么Sigmoid函数可以非常好的将 $\hat{y}$ 转换为概率值呢？我们可以绘制出图像来观察

import numpy as np
import matplotlib.pyplot as plt

def sigmoid(t):
	return 1 / (1 + np.exp(-t))
	
x = np.linspace(-10, 10, 500)
y = sigmoid(x)
plt.plot(x,y)
plt.show()

在这里插入图片描述
当t > 0 时，p > 0.5，当t < 0 时，p < 0.5，值域在(0, 1)之间
因此上式可以变换为：
$\hat{p} = σ(θ^T \cdot{x_b}) = \frac{1}{1+e^{-θ^T \cdot{x_b}}}$
$\hat{y}= \begin{cases} 1, & \text {$\hat{p}$ >= 0.5} \\ 0, & \text{$\hat{p}$ <= 0.5} \end{cases}$
因此现在的问题成为：对于给定的样本数据集X，y，我们如何找到参数θ，可以最大程度获得样本数据集X对应的分类输出y

二、逻辑回归的损失函数

根据逻辑回归公式两种分类的不同来定义损失函数：
$\begin{cases} & \text {如果y=1，p越小，cost越大} \\ & \text{如果y=0，p越大，cost越大} \end{cases}$
这里我们使用如下的函数来表示这种趋势：
$\begin{cases} -log(\hat{p}) & \text {if y=1} \\ -log(1-\hat{p}) & \text{if y=0} \end{cases}$
这里将函数进行调整，写在一个公式里：
$-ylog(\hat{p}) - (1-y)log(1-\hat{p})$
因此损失函数可以定义为：
$-\frac{1}{m}\sum_{i=1}^my^{(i)}log(\hat{p}^{(i)}) + (1-y^{(i)})log(1-\hat{p}^{(i)})$
$y^{(i)}$ ， ${p}^{(i)}$ 分别为第i个样本的真实值和估计值，其中
$\hat{p} = σ(X_b^{(i)} θ) = \frac{1}{1+e^{-X_b^{(i)} θ}}$
将 $\hat{p}$ 带入损失函数中
$-\frac{1}{m}\sum_{i=1}^my^{(i)}log(σ(X_b^{(i)} θ)) + (1-y^{(i)})log(1-σ(X_b^{(i)} θ))$