<<机器算法实战>>中logistcal回归中省略部分的推导
在该书中,第一版本的logistcal回归梯度上升优化算法中有几行代码:
其中最后一行代码隐含了一个结论,即:
初次接触时难免会对该结论有些困惑。该结论的具体的推导过程如下:
<<机器算法实战>>中logistcal回归中系数的收敛
书中利用随机梯度下降法预测病马死亡率时,多次重复调用模型,可以看出错误率变动仍然会比较大。这说明回归系数并没有很好的收敛。适当修改梯度下降函数,记录每次迭代回归系数的变动
def colicTest():
'''
@fun: colicTest --- 调用logistical regression训练函数,并返回模型的错误率
@para: N/A
@return: erroRate --- 模型错误率
'''
#载入训练数据
trainingFilePaht='horseColicTraining.txt'
trainingData=[]
trainingLabel=[]
with open(trainingFilePaht) as fr:
for line in fr.readlines():
strList=line.strip().split()
lineArray=[