罗辑回归小demo

最新推荐文章于 2024-10-09 23:54:44 发布

ITIRONMAN

最新推荐文章于 2024-10-09 23:54:44 发布

阅读量454

点赞数

文章标签：机器学习回归逻辑回归

本文链接：https://blog.csdn.net/qq_23953717/article/details/130586110

版权

逻辑回归

介绍

逻辑回归是一种广泛应用于分类问题的算法。与线性回归不同，逻辑回归可以处理离散输出变量，并且能够提供概率估计。

原理

Sigmoid函数

逻辑回归使用Sigmoid函数将线性组合转换为概率值。Sigmoid函数的公式如下：

$\sigma(z) = \frac{1}{1+e^{-z}}$

其中， $z=w^Tx+b$ 是输入的线性组合， $w$ 是权重向量， $x$ 是输入特征向量， $b$ 是偏置项。

Sigmoid函数的值域在 $(0, 1)$ 之间，表示为样本属于正类的概率。

损失函数

逻辑回归使用交叉熵损失函数来衡量模型的性能。对于二元分类问题，交叉熵损失函数的公式如下：

$J(w,b)=-\frac{1}{m}\sum_{i=1}^{m}[y^{(i)}\log(\hat{y}^{(i)})+(1-y^{(i)})\log(1-\hat{y}^{(i)})]$

其中， $m$ 是样本数， $y^{(i)}$ 是第 $i$ 个样本的真实标签值（取0或1）， $\hat{y}^{(i)}$ 是模型对第 $i$ 个样本的预测值（取0到1之间的概率值）。

梯度下降

逻辑回归使用梯度下降算法来最小化损失函数。梯度下降算法的公式如下：

$w=w-\alpha\frac{\partial J(w,b)}{\partial w}$

$b=b-\alpha\frac{\partial J(w,b)}{\partial b}$

其中， $\alpha$ 是学习率（learning rate）， $\frac{\partial J(w,b)}{\partial w}$ 和 $\frac{\partial J(w,b)}{\partial b}$ 分别是损失函数对权重和偏置项的偏导数。

通过更新权重和偏置项，模型可以逐步优化并提高预测性能。

代码演示

下面是一个使用Python实现逻辑回归的例子。我们将使用sklearn库中的Iris数据集进行演示。

首先，我们需要导入所需的库和数据集：

from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
import numpy as np
import matplotlib.pyplot as plt

# 加载Iris数据集
iris = load_iris()
X = iris.data[:, :2]  # 只使用前两个特征
y = (iris.target != 0) * 1 # 将标签转换为二元变量

# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1)

接下来，我们可以使用sklearn库中的LogisticRegression类创建模型并进行训练：

# 创建逻辑回归模型
lr = LogisticRegression()

# 训练模型
lr.fit(X_train, y_train)

训练完成后，我们可以使用测试集进行预测并计算模型的准确率：

# 预测测试集
y_pred = lr.predict(X_test)

# 计算准确率
accuracy = np.mean(y_pred == y_test)
print('Accuracy:', accuracy)

最后，我们可以绘制决策边界图来可视化模型的分类效果：

# 绘制决策边界
xx, yy = np.mgrid[4:8:.01, 2:4.5:.01]
grid = np.c_[xx.ravel(), yy.ravel().astype(np.float32))
probs = lr.predict_proba(grid)[:, 1].reshape(xx.shape)

f, ax = plt.subplots(figsize=(8, 6))
ax.contour(xx, yy, probs, levels=[.5], cmap="Greys", vmin=0, vmax=.6)
ax.scatter(X_test[:,0], X_test[:,1], c=y_test, s=50,
           cmap="RdBu", vmin=-.2, vmax=1.2,
           edgecolor="white", linewidth=1)

plt.show()