逻辑回归详解

最新推荐文章于 2023-05-27 10:50:55 发布

湘大小菜鸡

最新推荐文章于 2023-05-27 10:50:55 发布

阅读量1.2k

点赞数 2

分类专栏：算法优化文章标签：逻辑回归机器学习算法

本文链接：https://blog.csdn.net/m0_64357419/article/details/129854946

版权

算法优化专栏收录该内容

30 篇文章 0 订阅

订阅专栏

逻辑回归（Logistic Regression）是一种二分类（或多分类）的机器学习算法，用于建立分类模型并预测新的数据。该算法的基本思想是，根据输入数据的特征值计算出一个或多个数值，将其映射到一个概率值，用于表示该数据属于某一类的概率。具体来说，逻辑回归将一个线性方程和一个特定的函数（称为sigmoid函数）相结合，以将输入数据映射到一个介于0和1之间的值，该值可以被解释为属于某一类的概率。

逻辑回归模型的训练通常通过最大化似然函数来完成。在这个过程中，模型试图找到一组权重，使得预测概率与实际标签的差异最小化。常用的解决方法是使用梯度下降算法进行模型优化，通过迭代调整模型参数，使得模型的预测结果逐渐接近实际标签。

逻辑回归模型的优点在于简单易懂，计算效率高，适用于大规模数据集，并且可解释性较好，可以得到每个特征对预测结果的影响。它广泛应用于工业界和学术界，包括金融、医疗、广告、推荐系统等领域。但是，逻辑回归模型也有一些缺点，比如容易受到噪声和异常值的影响，对非线性关系的建模能力相对较弱，无法直接处理缺失值等问题。

逻辑回归的数学证明涉及到最大似然估计的推导过程。假设我们有一个二分类问题，即要将数据集分成两个类别（例如正例和反例），数据集包含n个样本，每个样本包含m个特征。我们使用逻辑回归模型来预测每个样本属于正例的概率，我们用y表示标签（y=1表示正例，y=0表示反例），x表示m个特征，用θ表示模型的参数。那么逻辑回归模型可以表示为：

hθ(x) = g(θTx)

其中，g(z)是sigmoid函数，表示将z映射到0和1之间：

g(z) = 1 / (1 + e^-z)

我们可以将逻辑回归模型理解为一个关于θ的函数hθ(x)，即hθ(x) = P(y=1|x;θ)，表示给定特征x和参数θ的条件下，样本属于正例的概率。

接下来，我们需要找到一个最佳的参数θ来最大化数据集的似然函数。似然函数L(θ)表示参数θ下数据集出现的概率，即：

L(θ) = ∏[hθ(x(i))]^(y(i)) * [1-hθ(x(i))]^(1-y(i))

其中，i表示第i个样本，y(i)表示第i个样本的标签，x(i)表示第i个样本的特征，hθ(x(i))表示第i个样本属于正例的概率，1-hθ(x(i))表示第i个样本属于反例的概率。

我们可以将似然函数取对数，并将它转化为一个损失函数，即：

J(θ) = -1/n * [∑y(i)log(hθ(x(i))) + (1-y(i))log(1-hθ(x(i)))]

其中，n表示样本数。

我们可以使用梯度下降算法来最小化损失函数，从而找到最佳的参数θ，使得模型的预测结果与实际标签尽可能接近。

以上是逻辑回归模型的数学推导过程。在实际应用中，我们通常使用机器学习框架来实现逻辑回归模型，并进行训练和预测。

假设我们有一个数据集，包含两个特征x1和x2，以及一个二分类的标签y，我们希望使用逻辑回归模型来预测新的数据点的标签。

首先，我们需要导入必要的库和数据集：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification

# 生成随机数据集
X, y = make_classification(n_samples=100, n_features=2, n_redundant=0, n_clusters_per_class=1, random_state=42)

接下来，我们可以将数据集可视化，以了解数据的分布情况：

# 可视化数据集
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.show()

接着，我们可以使用逻辑回归模型进行训练和预测。我们可以使用scikit-learn库中的LogisticRegression类来实现逻辑回归模型：

from sklearn.linear_model import LogisticRegression

# 创建逻辑回归模型
clf = LogisticRegression()

# 训练模型
clf.fit(X, y)

# 预测新的数据点
X_new = np.array([[0, 0], [2, 2]])
y_pred = clf.predict(X_new)
print("预测结果：", y_pred)

最后，我们可以将预测结果可视化：

# 可视化预测结果
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.scatter(X_new[:, 0], X_new[:, 1], c=y_pred, marker='s', s=100)
plt.show()

完整的代码示例如下：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression

# 生成随机数据集
X, y = make_classification(n_samples=100, n_features=2, n_redundant=0, n_clusters_per_class=1, random_state=42)

# 可视化数据集
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.show()

# 创建逻辑回归模型
clf = LogisticRegression()

# 训练模型
clf.fit(X, y)

# 预测新的数据点
X_new = np.array([[0, 0], [2, 2]])
y_pred = clf.predict(X_new)
print("预测结果：", y_pred)

# 可视化预测结果
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.scatter(X_new[:, 0], X_new[:, 1], c=y_pred, marker='s', s=100)
plt.show()

在上面的代码中，我们首先生成了一个随机数据集，然后使用逻辑回归模型进行训练和预测，最后将预测结果可视化。需要注意的是，逻辑回归模型通常需要对特征进行标准化处理，以提高模型的性能和收敛速度。

逻辑回归模型的可视化通常包括两部分：数据集的可视化和决策边界的可视化。下面，我将举一个简单的例子来说明如何使用Python代码进行逻辑回归模型的可视化。

假设我们有一个数据集，包含两个特征x1和x2，以及一个二分类的标签y。我们可以使用matplotlib库来将数据集可视化：

import matplotlib.pyplot as plt
import numpy as np

# 生成随机数据集
np.random.seed(0)
X = np.random.randn(200, 2)
y = np.logical_xor(X[:, 0] > 0, X[:, 1] > 0)

# 可视化数据集
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Paired)
plt.xlabel('x1')
plt.ylabel('x2')
plt.show()

在上面的代码中，我们首先生成了一个随机数据集，然后使用plt.scatter()函数将数据集可视化。其中，参数c表示数据点的颜色，cmap参数指定了颜色映射。

接下来，我们可以使用逻辑回归模型进行训练和预测。我们可以使用scikit-learn库中的LogisticRegression类来实现逻辑回归模型：

from sklearn.linear_model import LogisticRegression

# 创建逻辑回归模型
clf = LogisticRegression()

# 训练模型
clf.fit(X, y)

# 预测所有数据点的标签
xx, yy = np.meshgrid(np.linspace(-3, 3, 500), np.linspace(-3, 3, 500))
Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])

# 将预测结果可视化
Z = Z.reshape(xx.shape)
plt.contourf(xx, yy, Z, cmap=plt.cm.Paired)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Paired)
plt.xlabel('x1')
plt.ylabel('x2')
plt.show()

在上面的代码中，我们首先使用逻辑回归模型对数据集进行训练，然后使用np.meshgrid()函数生成了一个二维网格，并将网格中的点作为输入，对所有数据点进行了预测。接着，我们使用plt.contourf()函数将预测结果可视化，并使用plt.scatter()函数将数据集可视化。最后，我们使用plt.xlabel()和plt.ylabel()函数添加了x轴和y轴的标签。

完整的代码示例如下：

import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model import LogisticRegression

# 生成随机数据集
np.random.seed(0)
X = np.random.randn(200, 2)
y = np.logical_xor(X[:, 0] > 0, X[:, 1] > 0)

# 可视化数据集
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Paired)
plt.xlabel('x1')
plt.ylabel('x2')
plt.show()

# 创建逻辑回归模型
clf = LogisticRegression()

#训练模型
clf.fit(X, y)

#预测所有数据点的标签
xx, yy = np.meshgrid(np.linspace(-3, 3, 500), np.linspace(-3, 3, 500))
Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])

#将预测结果可视化
Z = Z.reshape(xx.shape)
plt.contourf(xx, yy, Z, cmap=plt.cm.Paired)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Paired)
plt.xlabel('x1')
plt.ylabel('x2')
plt.show()

运行上述代码，我们可以得可视化结果

在上面的可视化中，红色和蓝色的数据点分别表示两个不同的类别，白色区域表示逻辑回归模型的决策边界。我们可以看到，逻辑回归模型成功地将两个类别分开，并且决策边界大致呈现出线性的形状。

湘大小菜鸡

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
逻辑回归详解

在上面的代码中，我们首先使用逻辑回归模型对数据集进行训练，然后使用np.meshgrid()函数生成了一个二维网格，并将网格中的点作为输入，对所有数据点进行了预测。我们使用逻辑回归模型来预测每个样本属于正例的概率，我们用y表示标签（y=1表示正例，y=0表示反例），x表示m个特征，用θ表示模型的参数。其中，i表示第i个样本，y(i)表示第i个样本的标签，x(i)表示第i个样本的特征，hθ(x(i))表示第i个样本属于正例的概率，1-hθ(x(i))表示第i个样本属于反例的概率。
复制链接

扫一扫