对数几率回归

WT_cnyali

于 2022-10-05 14:28:41 发布

阅读量531

点赞数

分类专栏：模式识别与机器学习文章标签： python 机器学习分类逻辑回归

本文链接：https://blog.csdn.net/WT_cnyali/article/details/127172148

版权

模式识别与机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

利用sklearn中的load_breast_cancer数据集进行对数几率回归分类

先导入一下数据，再把矩阵调整成按列存储每个样本的形式

cancer = datasets.load_breast_cancer()
X,y = cancer['data'], cancer['target']
X = StandardScaler().fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3, random_state=42)

m = X_train.shape[0]
m_test = X_test.shape[0]
n = X_train.shape[1]
X_train = np.array(X_train)
x = np.concatenate((X_train,np.ones((m,1),dtype=X_train.dtype)), axis=1).T
beta = np.zeros((n+1,1))
y_train.reshape(1,m)

定义sigmoid函数 $S(z)=\frac{1}{1+e^{-z}}$

def Si(z):
    return 1/(1+np.exp(-z))

强制确定牛顿迭代法的迭代深度，再进行迭代。老师的课件上给出的是累加的形式，但是一阶导可以用矩阵的形式表达，二阶导就是一个向量乘自己的转置，可以把 $p_1(1-p_1)$ 看作是每一项的系数，不妨把 $p_{1,i}$ 升为一个对角矩阵，然后再利用矩阵实现。

Max_Ite = 50
for t in range(Max_Ite):
    p1 = Si(np.dot(beta.T, x))
    grad = np.dot(x,(p1-y_train).T)
    gg2 = np.dot(x, np.dot(np.diag((p1-p1*p1).reshape(m,)),x.T))
    beta = beta - np.linalg.solve(gg2,grad)
#print("beta=", beta.T)

最后可以把 $\beta=<\omega, b>$ 打出来

利用对率回归进行预测，并检测准确性

y_pred = np.empty_like(y_test)
X_test = np.concatenate((X_test,np.ones((m_test,1),dtype=X_test.dtype)), axis=1).T
l = Si(np.dot(beta.T, X_test)).flatten()
for i in range(m_test):
    if l[i]>0.5:
        y_pred[i] = 1
    else:
        y_pred[i] = 0
print('precision: ', accuracy_score(y_test, y_pred))

但是神奇的是运行的中间结果爆掉了，算出来的 $\beta$ 不收敛。这组数据的大小是

print("shape=", n, m)

shape= 30 398

然后我就把每个数据第26个特征起以后的属性都不要了，也就是：

n = 25
X_train = X_train[:,0:n]
X_test = X_test[:,0:n]

最终得到的结果也还行：

precision:  0.9532163742690059

以下是完整代码：

#!/usr/bin/env python
# coding: utf-8

import numpy as np
from sklearn import datasets, linear_model
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

# import data
cancer = datasets.load_breast_cancer()
X,y = cancer['data'], cancer['target']
X = StandardScaler().fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3, random_state=42)

n = 25
X_train = X_train[:,0:n]
X_test = X_test[:,0:n]

m = X_train.shape[0]
m_test = X_test.shape[0]
n = X_train.shape[1]
X_train = np.array(X_train)
x = np.concatenate((X_train,np.ones((m,1),dtype=X_train.dtype)), axis=1).T
beta = np.zeros((n+1,1))
y_train.reshape(1,m)
#print("shape=", n, m)

def Si(z):
    return 1/(1+np.exp(-z))
Max_Ite = 50
for t in range(Max_Ite):
    p1 = Si(np.dot(beta.T, x))
    grad = np.dot(x,(p1-y_train).T)
    gg2 = np.dot(x, np.dot(np.diag((p1-p1*p1).reshape(m,)),x.T))
    beta = beta - np.linalg.solve(gg2,grad)

#print("beta=", beta.T)
y_pred = np.empty_like(y_test)
X_test = np.concatenate((X_test,np.ones((m_test,1),dtype=X_test.dtype)), axis=1).T
l = Si(np.dot(beta.T, X_test)).flatten()
for i in range(m_test):
    if l[i]>0.5:
        y_pred[i] = 1
    else:
        y_pred[i] = 0

print('precision: ', accuracy_score(y_test, y_pred))

输出的 $\beta$ 和准确度为

beta= [[ -25.7523818     3.17634347  108.15206595  -43.22151497    1.56521521
    50.74155133  -56.88274302  -11.26094169   -2.83976125  -26.87876068
   -74.99938566    9.57940252   40.73596439   20.84486128    3.88865309
   -18.76046644   20.32546863  -20.28042746    4.7779897    24.7781943
  -112.76540417  -23.93186562  -81.68191927  119.62649284   -7.53212998
    -2.20112507]]
precision:  0.9532163742690059

截图如下
代码及运行结果