机器算法实战中logistcal回归与SKlearn库算法对比

最新推荐文章于 2022-10-23 14:01:38 发布

Lunar112

最新推荐文章于 2022-10-23 14:01:38 发布

阅读量550

点赞数 1

分类专栏：机器学习文章标签：优化算法 logistical

本文链接：https://blog.csdn.net/Lunar112/article/details/73064940

版权

<<机器算法实战>>中logistcal回归中省略部分的推导

在该书中，第一版本的logistcal回归梯度上升优化算法中有几行代码：
log code
其中最后一行代码隐含了一个结论，即：
equation1

初次接触时难免会对该结论有些困惑。该结论的具体的推导过程如下：

这里写图片描述

<<机器算法实战>>中logistcal回归中系数的收敛

书中利用随机梯度下降法预测病马死亡率时，多次重复调用模型，可以看出错误率变动仍然会比较大。这说明回归系数并没有很好的收敛。适当修改梯度下降函数，记录每次迭代回归系数的变动



def colicTest():
    '''
    @fun: colicTest      --- 调用logistical regression训练函数，并返回模型的错误率
    @para: N/A
    @return: erroRate    --- 模型错误率
    '''
    #载入训练数据
    trainingFilePaht='horseColicTraining.txt'
    trainingData=[]
    trainingLabel=[]
    with open(trainingFilePaht) as fr:
        for line in fr.readlines():
            strList=line.strip().split()
            lineArray=[