《机器学习实战》第五章学习笔记(Logistic回归)

本文详细介绍了Logistic回归的原理和应用,包括Logistic分布、模型构建、参数估计方法(极大似然估计和梯度上升法),并通过实际代码展示了如何用梯度上升算法估计最佳参数。最后,通过预测病马的死亡率案例,进一步阐述Logistic回归的实际应用。
摘要由CSDN通过智能技术生成

利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的“回归”一词源于最佳拟合,表示要找到最佳拟合参数集。训练分类器时的做法就是寻找最佳拟合参数,使用的是最优化算法。

一、 Logistic分布

二、  Logistic回归模型(二分类模型)

其中,sigmoid函数:

                                        

换言之,直接利用sigmoid函数理解二分类Logistic回归模型:

P(Y=1|x)=sigmoid(z);P(Y=0|x)=1-P(Y=1|x)=sigmoid(z)。其中,z的表达式如下:


三、 模型参数估计

3.1 极大似然函数的方式估计参数:

3.2 梯度上升法估计参数

梯度上升算法用来求函数的最大值,而梯度下降算法用来求函数的最小值。

梯度上升算法迭代公式:


推导第一个:其中e是误差,样本矩阵x,类别标签y,回归系数w,步长a。

梯度上升的目的是最小化误差:

四、基于梯度上升算法估计最佳参数

4.1 代码实现

# -*- coding: utf-8 -*-
"""
Created on Wed Apr 18 19:07:15 2018
file name:logRegres.py
@author: lizihua
"""
import numpy as np
from numpy import exp,mat,shape,ones,array,random
import matplotlib.pyplot as plt
#Logistic回归梯度上升优化算法
#加载数据
#注意,返回的是列表!!!
def loadDataSet():
    dataMa
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值