逻辑回归python实现实例

这篇博客通过《机器学习实战》中的马疝病数据集,展示了如何用Python实现逻辑回归。内容包括处理数据集中的缺失值,采用批处理梯度下降法训练模型,并探讨了特征归一化对模型性能的影响。在未归一化处理的情况下,模型在训练集和测试集上的准确率分别为73%和78%;归一化后,准确率稍有下降,但训练效率提升。
摘要由CSDN通过智能技术生成

这个例子是《机器学习实战》(<machine learning in action>)逻辑回归的一个实例:从疝气病症预测病马的死亡率。


疝病是描述马胃肠痛的术语。该数据集中包含了医院检查马疝病的一些指标,我们的目标是通过这些指标(特征),来预测马是否会死亡。

数据集包括229个训练样本和67各测试样本,特征数量为22。数据集中包含缺失值,采取的措施是用0替换所有缺失值,这样做的原因是,我们在更新theta值时使用下式(具体参考上一篇),当某个特征值缺失时,我们如果用0来替代,则对应的theta值不会被更新(公式右边第二项=0),即缺失值不会对参数造成影响。


以下为python代码,由于训练数据比较少,这边使用了批处理梯度下降法,没有使用增量梯度下降法。

##author:lijiayan
##data:2016/10/27
##name:logReg.py
from numpy import *
import matplotlib.pyplot as plt


def loadData(filename):
    data = loadtxt(filename)
    m,n = data.shape
    print 'the number of  examples:',m
    print 'the number of features:',n-1
    x = data[:,0:n-1]
    y = data[:,n-1:n]
    return x,y


#the sigmoid function
def sigmoid(z):
    return 1.0 / (1 + exp(-z))


#the cost function
def costfunction(y,h):
    y = array(y)
    h 
  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值