用python做逻辑回归_python实现逻辑回归

最新推荐文章于 2024-07-15 10:49:30 发布

weixin_39738152

最新推荐文章于 2024-07-15 10:49:30 发布

阅读量469

点赞数

文章标签：用python做逻辑回归

本文介绍了逻辑回归的基本概念，包括sigmoid函数的性质及其在模型中的作用。通过sigmoid函数的特性，我们理解了为何选择它作为分类决策边界，并详细解析了代价函数的定义及其优化方法。此外，文章还展示了如何用Python实现逻辑回归算法并应用到鸢尾花数据集上。

摘要由CSDN通过智能技术生成

首先得明确逻辑回归与线性回归不同，它是一种分类模型。而且是一种二分类模型。

首先我们需要知道sigmoid函数，其公式表达如下：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTEwNDYwMDk0OC03NzA4OTM4MjAucG5n

其函数曲线如下：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTEwNDYxOTU3NS0xMTg5MjUwMDQxLnBuZw==

sigmoid函数有什么性质呢？

1、关于（0,0.5）对称

2、值域范围在(0,1)之间

3、单调递增

4、光滑

5、中间较陡，两侧较平缓

6、其导数为g(z)(1-g(z))，即可以用原函数直接计算

于是逻辑回归的函数形式可以用以下公式表示：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTEwNTE0NDYyNS00ODkwMTc4OTkucG5n

其中θ表示权重参数，x表示输入。θTx为决策边界，就是该决策边界将不同类数据区分开来。

为什么使用sigmoid函数呢？

1、sigmoid函数本身的性质

2、推导而来

我们知道伯努利分布：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMDc0MjE3Ny02NjAwODc4Mi5wbmc=

当x=1时，f(1|p) =p，当x=0时，f(0|p)=1-p

首先要明确伯努利分布也是指数族，指数族的一般表达式为：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMTMxNzE5Mi04MzE3ODQzMjUucG5n

由于：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMTUyNTkwMC04OTA0ODM5MTYucG5n

则有：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMjA1OTQ5MC0yMzY1MTI3NTMucG5n

所以：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMjQyOTI0My0xNDcyMjkyNDU0LnBuZw==

因为：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMjYyODM1NC0xNTYwMDQ0Nzg5LnBuZw== 则有：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMzI1NTEzOS0yMTA1MzYyNDIxLnBuZw==

逻辑回归代价函数：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTEwNTUzMzUzOC0yMDkxNzc3NDMwLnBuZw==

为什么这么定义呢？

以单个样本为例：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMDEzMzU5MS0xMjg1MTQ2MjAwLnBuZw==

上面式子等价于：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTEwNTg1NDM2Ni0xMzkzNDM5MTA2LnBuZw==

当y=1时，其图像如下：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMzUxMzI0OS0xNzc4NjUyNjU0LnBuZw==

也就是说当hθ(x)的值越接近1，C(θ) 的值就越小。

同理当y=0时，其图像如下：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMzY1NjQ0MC0xOTMzMzgyOTgzLnBuZw==

也就是说当hθ(x)的值越接近0，C(θ) 的值就越小。

这样就可以将不同类区分开来。

代价函数的倒数如下：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMzgxNDM5NC0xNzYyMzE2NjAyLnBuZw==

推导过程如下：

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMzkwNTM4NC0xNzUyMzczNjM2LnBuZw==

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTExMzkyMTc2OC0xMzk0Mjg3OTMyLnBuZw==

上面参考了：

from __future__ importprint_function, divisionimportnumpy as npimportmathfrom mlfromscratch.utils importmake_diagonal, Plotfrom mlfromscratch.deep_learning.activation_functions importSigmoidclassLogisticRegression():"""Logistic Regression classifier.

Parameters:

-----------

learning_rate: float

The step length that will be taken when following the negative gradient during

training.

gradient_descent: boolean

True or false depending if gradient descent should be used when training. If

false then we use batch optimization by least squares."""

def __init__(self, learning_rate=.1, gradient_descent=True):

self.param=None

self.learning_rate=learning_rate

self.gradient_descent=gradient_descent

self.sigmoid=Sigmoid()def_initialize_parameters(self, X):

n_features= np.shape(X)[1]#Initialize parameters between [-1/sqrt(N), 1/sqrt(N)]

limit = 1 /math.sqrt(n_features)

self.param= np.random.uniform(-limit, limit, (n_features,))def fit(self, X, y, n_iterations=4000):

self._initialize_parameters(X)#Tune parameters for n iterations

for i inrange(n_iterations):#Make a new prediction

y_pred =self.sigmoid(X.dot(self.param))ifself.gradient_descent:#Move against the gradient of the loss function with

#respect to the parameters to minimize the loss

self.param -= self.learning_rate * -(y -y_pred).dot(X)else:#Make a diagonal matrix of the sigmoid gradient column vector

diag_gradient =make_diagonal(self.sigmoid.gradient(X.dot(self.param)))#Batch opt:

self.param = np.linalg.pinv(X.T.dot(diag_gradient).dot(X)).dot(X.T).dot(diag_gradient.dot(X).dot(self.param) + y -y_pred)defpredict(self, X):

y_pred=np.round(self.sigmoid(X.dot(self.param))).astype(int)return y_pred

说明：np.linalg.pinv()用于计算矩阵的pseudo-inverse（伪逆）。第一种方法求解使用随机梯度下降。

其中make_diagonal()函数如下：用于将向量转换为对角矩阵

defmake_diagonal(x):"""Converts a vector into an diagonal matrix"""m=np.zeros((len(x), len(x)))for i inrange(len(m[0])):

m[i, i]=x[i]return m

其中Sigmoid代码如下：

classSigmoid():def __call__(self, x):return 1 / (1 + np.exp(-x))defgradient(self, x):return self.__call__(x) * (1 - self.__call__(x))

最后是主函数运行代码：

from __future__ importprint_functionfrom sklearn importdatasetsimportnumpy as npimportmatplotlib.pyplot as plt#Import helper functions

importsys

sys.path.append("/content/drive/My Drive/learn/ML-From-Scratch/")from mlfromscratch.utils importmake_diagonal, normalize, train_test_split, accuracy_scorefrom mlfromscratch.deep_learning.activation_functions importSigmoidfrom mlfromscratch.utils importPlotfrom mlfromscratch.supervised_learning importLogisticRegressiondefmain():#Load dataset

data =datasets.load_iris()

X= normalize(data.data[data.target !=0])

y= data.target[data.target !=0]

y[y== 1] =0

y[y== 2] = 1X_train, X_test, y_train, y_test= train_test_split(X, y, test_size=0.33, seed=1)

clf= LogisticRegression(gradient_descent=True)

clf.fit(X_train, y_train)

y_pred=clf.predict(X_test)

accuracy=accuracy_score(y_test, y_pred)print ("Accuracy:", accuracy)#Reduce dimension to two using PCA and plot the results

Plot().plot_in_2d(X_test, y_pred, title="Logistic Regression", accuracy=accuracy)if __name__ == "__main__":

main()

结果：

Accuracy: 0.9393939393939394

img?u=aHR0cHM6Ly9pbWcyMDIwLmNuYmxvZ3MuY29tL2Jsb2cvMTUwMzAzOS8yMDIwMDUvMTUwMzAzOS0yMDIwMDUwMTEyMjc1NTY4MC02MzMzOTMzNzcucG5n

weixin_39738152

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
用python做逻辑回归_python实现逻辑回归

首先得明确逻辑回归与线性回归不同，它是一种分类模型。而且是一种二分类模型。首先我们需要知道sigmoid函数，其公式表达如下：其函数曲线如下：sigmoid函数有什么性质呢？1、关于（0,0.5）对称2、值域范围在(0,1)之间3、单调递增4、光滑5、中间较陡，两侧较平缓6、其导数为g(z)(1-g(z))，即可以用原函数直接计算于是逻辑回归的函数形式可以用以下公式表示：其中θ表示权重参数，x表...
复制链接

扫一扫