对率回归的实验

最新推荐文章于 2023-07-30 21:13:30 发布

塔楼

最新推荐文章于 2023-07-30 21:13:30 发布

阅读量2.3k

点赞数 1

分类专栏：机器学习算法文章标签： T

本文链接：https://blog.csdn.net/qq_28915885/article/details/82114942

版权

机器学习同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

算法

9 篇文章 0 订阅

订阅专栏

对数几率回归在python中的实现

在做分类任务时，需要找一个单调可微函数将分类任务的真实标记y与线性回归模型所预测的值联系起来。对数几率函数是用来“替代”单位跃阶函数的，满足单调可微的条件。以下是对数几率函数： $y=1/{(1+e^{-z})}$ ，其中 $z= w^Tx+b$ 。对其进行取对数，得到

l n (y / (1 - y)) = w T x + b

$ln(y/(1-y))=w^Tx+b$
该公式的解释：将y视为样本x作为正样本的可能性，1-y视为其反列的可能性，对几率取对数得到对数几率。
若将y视为类后验概率估计p(y=1| x)，则对数几率可以写为：

l n (p (y = 1 | x) / p (y = 0 | x)) = w T x + b

$ln(p(y=1|x)/p(y=0|x))=w^Tx+b$
通过极大似然法来估计 w和b。对给定的数据{{ $x_i$ ,

yi y i $y_i$ }}

mi=1 i = 1 m $^m_{i=1}$ ，对数回归模型最大化‘对数似然

l (w, b) = \sum i = 1 m l n p (y i | x i; w, b)

$l(\mathbf{w},b)=\sum_{i=1}^m lnp(y_i|\mathbf{x_i;w,}b)$
改写似然项后可以得到最终公式为

l (β) = \sum i = 1 m (- y i β T x i + l n (1 + e x p (β T x i)))

$l(\beta) = \sum_{i=1}^m (-y_i\beta^T\mathbf x_i + ln(1+exp(\mathbf{\beta^Tx_i})))$
求得最优解

β∗=argminβl(β) β ∗ = a r g m i n β l ( β ) $\beta ^* = arg min_\beta l(\beta)$
本文中采用牛顿法：

β t + 1 = β t - (\partial 2 l ( β ) \partial β \partial β T) - 1 (\partial l ( β ) \partial β)

$\beta ^{t+1} = \beta ^t - (\frac{\partial^{2}l(\beta)}{\partial \beta \partial \beta^T})^-{1} (\frac{\partial l(\beta)}{\partial \beta})$
分别求得一阶导数和二阶导数得到：

\partial l ( β ) \partial β = - \sum i = 1 m x i (y - p 1 (x i; β))

$\frac{\partial l(\beta)}{\partial \beta} = -\sum_{i=1}^m\mathbf x_i(y_-p_1(\mathbf {x_i;\beta}))$

\partial 2 l ( β ) \partial β \partial β T = \sum i = 1 m x i x T i p 1 (x i; β) (1 - p 1 (x i; β))

$\frac{\partial^{2}l(\beta)}{\partial \beta \partial \beta^T} = \sum_{i=1}^m \mathbf {x_i x_i^T}p_1(\mathbf{ x_i;\beta})(1-p_1(\mathbf{x_i;\beta}))$

以上就是对率回归的模型。以下在《机器学习》书中的西瓜数据3.0中实验：

# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd

inputfile = 'xigua3.0.xlsx'

#导入数据
data = pd.read_excel(inputfile, 'Sheet1')
x = np.array([list(data[u'密度']),list(data[u'含糖率']),[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]])
x = x.T
y = np.array([1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0])

#初始化参数
beta = np.array([[0.01],[0.03],[1]])
l_beta = 0
old_l_beta = 0
n = 0
while True:
    #计算l(beta)

    beta_T = np.transpose(beta)
   # print(np.array([x[0,:]]).shape)
    for i in np.arange(len(x)):
        l_beta = l_beta + (-y[i]*np.dot(beta_T, np.array([x[i,:]]).T) +  np.log(1+np.exp(np.dot(beta_T,np.array([x[i,:]]).T))))

    if np.abs(l_beta - old_l_beta).any()<=0.000001:
        break
    #进行迭代
    dbeta = 0
    d2beta = 0
    n = n+1
    old_l_beta = l_beta
    for i in np.arange(len(x)):
        x_i = np.array([x[i,:]])
        x_i_2 = np.dot(x_i,x_i.T)
        exp_b_x = np.exp(np.dot(np.transpose(beta),x_i.T))  

        dbeta = dbeta - np.array([x[i,:]])*( y[i]-( exp_b_x/(1+exp_b_x)))

        d2beta = d2beta + x_i_2*exp_b_x/((1+exp_b_x)*(1+exp_b_x))
    beta = beta - np.dot(np.linalg.inv(d2beta),dbeta).T

    print("迭代次数=>", n)
    print('模型参数=>', beta)
if __name__ == '__main__':
    print(beta)

塔楼

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
对率回归的实验

对数几率回归在python中的实现在做分类任务时，需要找一个单调可微函数将分类任务的真实标记y与线性回归模型所预测的值联系起来。对数几率函数是用来“替代”单位跃阶函数的，满足单调可微的条件。以下是对数几率函数：y=1/(1+e−z)y=1/(1+e−z)y=1/{(1+e^{-z})}，其中z=wTx+bz=wTx+bz= w^Tx+b。对其进行取对数，得到ln(y/(1−y))=wTx+bl...
复制链接

扫一扫

专栏目录