实验六——logistisc回归

最新推荐文章于 2024-10-07 06:31:57 发布

诶滴仔

最新推荐文章于 2024-10-07 06:31:57 发布

阅读量199

点赞数 4

文章标签：回归数据挖掘人工智能

本文链接：https://blog.csdn.net/2201_76121495/article/details/139294401

版权

逻辑回归是一种用于处理分类问题的统计学习方法，它被广泛应用于机器学习和数据分析领域。

逻辑回归的优缺点：

优点：

解释性强：逻辑回归能够提供各个特征对于分类结果的影响程度，因此在需要理解变量影响的情况下具有较好的可解释性。
计算代价低：相对于一些复杂的分类模型，逻辑回归的计算代价比较低，训练速度快，尤其适合处理大规模数据集。
输出结果自然地表示为概率：逻辑回归的输出是一个概率值，可以直观地理解样本属于某一类的可能性。
容易更新模型：当新数据到来时，可以方便地通过在线学习的方式更新逻辑回归模型。

缺点：

只能处理线性可分问题：逻辑回归是一个线性分类器，在处理非线性问题时表现不佳，需要进行特征工程或者使用核技巧等方法进行处理。
对异常值敏感：逻辑回归对异常值比较敏感，异常值可能会对模型产生较大影响，需要进行数据预处理和异常值处理。
无法很好地处理大量特征或者特征之间相关性较强的情况，容易出现过拟合问题。

实现：

import numpy as np
from scipy.optimize import minimize

# 极大似然估计函数
def likelihood_function(beta, X, y):
    scores = np.dot(X, beta)
    ll = np.sum(y * scores - np.log(1 + np.exp(scores)))
    return -ll  # 最大化对数似然函数等价于最小化相反数

# 最优化求解
def fit_logistic_regression(X, y):
    num_features = X.shape[1]
    initial_beta = np.zeros(num_features)  # 初始参数值
    result = minimize(likelihood_function, initial_beta, args=(X, y), method='BFGS')
    return result.x

# 示例数据
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])

# 拟合逻辑回归模型
beta_hat = fit_logistic_regression(X, y)
print("最佳回归系数:", beta_hat)

小结：

在上述的代码中，使用极大似然估计和最优化方法来拟合逻辑回归模型，最终得到的beta_hat即为最佳的回归系数。这些系数可以用于构建逻辑回归模型，进而进行预测和分类任务。