《机器学习实战》--LR

最新推荐文章于 2024-09-08 12:03:05 发布

原创最新推荐文章于 2024-09-08 12:03:05 发布 · 207 阅读

0 ·

CC 4.0 BY-SA版权

AI 专栏收录该内容

32 篇文章

订阅专栏

LR公式推导：
https://blog.csdn.net/Dinosoft/article/details/34960693 损失函数和最小二乘相近。最大似然和最小化损失函数相近

应该属于二项分布的广义线性模型：
http://www.huaxiaozhuan.com/统计学习/chapters/1_linear.html

原始课件：
http://cs229.stanford.edu/notes-spring2019/cs229-notes1.pdf

书上的例子可以体会下SGD得到权重中随机的用法，一次随机用一个样本来更新权重值，然后将这个样本从数据集中删掉
梯度的计算，通过公式推导，得到梯度：（y-h）* xi

注意权重的个数和特征是一致的，所用样本的相同特征用的是相同的特征值。

ps: 代码里没必要一定用mat,可以用array.

import numpy as np
import matplotlib.pyplot as plt

def loadDataSet(file_name):
    dataMat = []
    labelMat = []

    with open(file_name) as f:
        for line in f.readlines():
            lineArr = line.strip().split()
            dataMat.append([1.0,float(lineArr[0]),float(lineArr[1])])
            labelMat.append(int(lineArr[2]))

    return dataMat,labelMat

def sigmod(Z):
    return 1.0 / (1+ np.exp(-Z))

def thanh(Z):
    return (np.exp(Z) - np.exp(-Z)) / (np.exp(Z) + np.exp(-Z))

def gradAscent(dataSet,label):
    dataMat = np.mat(dataSet)   #  (m,n)
    m,n = np.shape(dataMat)
    lableMat = np.mat(label).transpose()  ## (m,1)

    alpha = 0.001
    maxCycle = 1000000

    weights = np.ones((n,1))
    for i in range(maxCycle):
        h = sigmod(dataMat*weights)  #   ( m,1 )
        #h = thanh(dataMat*weights)
        error = (lableMat-h)     # (m,1)
        weights = weights + alpha * dataMat.transpose() * error

    return np.asarray(weights).squeeze()


def stocGradAscent(dataSet,label):
    dataMat = np.mat(dataSet)
    m,n = np.shape(dataMat)
    lableMat = np.mat(label).transpose()

    weights = np.ones(n)
    alpha = 0.001

    maxCyclye = 800

    for i in range(maxCyclye):
        dataIndex = list(range(m))
        #print("len: ",len(dataIndex))
        for j in range(m):
            alpha = 4/(1+i+j) + 0.001
            randIdx = np.random.randint(len(dataIndex))
            #print("dataMat.shape: ",dataMat[dataIndex[randIdx]].shape)
            #print("weights.shape: ",weights.shape)
            h = sigmod(sum(np.asarray(dataMat[dataIndex[randIdx]]).squeeze()*weights))
            #print("cur: ",dataIndex[randIdx])
            error = lableMat[dataIndex[randIdx]] - h
            #print(error.shape)
            weights = weights + alpha * error * dataMat[dataIndex[randIdx]]
            weights = np.asarray(weights).squeeze()
            #print("wei.shape: ",weights.shape)
            del dataIndex[randIdx]
            #print("result: ",len(dataIndex))

    return weights

def plotBestFit(dataSet,label,weights):

    xcord1 = []
    ycord1 = []
    xcord2 = []
    ycord2 = []

    m = len(dataSet)
    n = len([dataSet[0]])

    for i in range(m):
        if (label[i]==0):
            xcord1.append(dataSet[i][0])
            ycord1.append(dataSet[i][1])
        elif label[i]==1:
            xcord2.append(dataSet[i][0])
            ycord2.append(dataSet[i][1])

    fig = plt.figure()
    ax = fig.add_subplot(111)

    ax.scatter(xcord1,ycord1,s= 30,c = 'red',marker = 's')    ## 两种点分开画
    ax.scatter(xcord2,ycord2,s= 30,c = 'green',)

    x = np.arange(-2.0,2.0,0.10)
    print("------------weight:-----",weights)
    y = (-weights[0]-weights[1]*x)/weights[2]
    ax.plot(x,y)                                         #  画拟合直线

    plt.xlabel('X')
    plt.ylabel('Y')
    plt.show()

def simpleTest():
    dataSet,lable = loadDataSet('LR.txt')
    weights = stocGradAscent(dataSet,lable)
    #weights = gradAscent(dataSet,lable)
    plotBestFit(dataSet,lable,weights)



def classifyVector(intX,weights):
    '''
        Desc:
            最终的分类函数，根据回归系数和特征向量来计算 Sigmoid 的值，大于0.5函数返回1，否则返回0
        Args:
            inX -- 特征向量，features
            weights -- 根据梯度下降/随机梯度下降 计算得到的回归系数
        Returns:
            如果 prob 计算大于 0.5 函数返回 1
            否则返回 0
    '''

    prob = sigmod(intX*weights)
    if prob>0.5:
        return 1.0
    else:return 0.0






if __name__ == '__main__':
    data,lable = loadDataSet('LR.txt')
    print(data)
    print(lable)
    # print(type(lable))
    # m = np.mat(data)
    # print(m)
    # print(type(m))
    # l = np.mat(lable)
    # print(l)
    # print(l.shape)
    # print(l.transpose())
    # print(np.exp(a))
    # a = np.array([1])
    simpleTest()