【逻辑回归】

最新推荐文章于 2024-05-29 16:42:20 发布

Vici__

最新推荐文章于 2024-05-29 16:42:20 发布

阅读量159

点赞数

分类专栏： private

本文链接：https://blog.csdn.net/vici__/article/details/107551013

版权

private 专栏收录该内容

166 篇文章 14 订阅

订阅专栏

在线性回归的基础上，使用梯度下降的方法降低损失值，找到最优参数，另外需要在最后加上softmax函数。

import numpy as np

class LogisticRegression():
    def __init__(self):
        self._theta = None
        self._coef = None
        self._intercept = None

    def _sigmoid(self, t):
        return 1. / (1 + np.exp(-t))

    def fit(self, X_train, y_train, eta=0.01, n_iters=10000):
        def J(theta, X_b, y): # 交叉熵损失函数
            y_hat = self._sigmoid(X_b.dot(theta))
            try:
                return - np.sum(y * np.log(y_hat) + (1-y) * np.log(1-y_hat)) / len(y)
            except:
                return float("inf")
        
        def dJ(theta, X_b, y):
            return (self._sigmoid(X_b.dot(theta)) - y).dot(X_b) / len(y)

        def gradient_descent(X_b, y, initial_theta, eta, n_iters, epsilon=1e-8):
            theta = initial_theta
            thetas = []
            cur_iter = 0
            while cur_iter < n_iters:
                gradient = dJ(theta, X_b, y)
                last_theta = theta
                theta = theta - gradient * eta
                thetas.append(theta)
                # print(theta)
                if abs(J(theta, X_b, y)-J(last_theta, X_b, y)) <= epsilon:
                    break
                cur_iter += 1
            return theta
        
        X_b = np.hstack([np.ones((len(X_train), 1)), X_train])
        initial_theta = np.zeros(X_b.shape[1])
        self._theta = gradient_descent(X_b, y_train, initial_theta, eta, n_iters)
        self._coef = self._theta[1:]
        self._intercept = self._theta[0]
        return self

    def predict_probability(self, X_predict):
        X_b = np.hstack([np.ones((len(X_predict), 1)), X_predict])
        return self._sigmoid(X_b.dot(self._theta))

    def predict(self, X_predict):
        probability = self.predict_probability(X_predict)
        return np.array(probability >= 0.5, dtype='int')
    
    def score(self, y_true, y_predict):
        return np.sum(y_true == y_predict) / len(y_true)