逻辑回归
逻辑回归其实是一种分类模型,它是基于线性回归的一种回归算法预测。
线性回归的形式一般为 y = a x + b y=ax+b y=ax+b,将y的结果代入一个非线性变换的sigmoid函数(形似s的函数)中
sigmoid函数如下
其结果就会被控制在0~1之间,可以设定一个阈值,在该阈值之上定为1,该阈值之下定为0,那么就实现了这个问题的二分类。
基于鸢尾花(iris)数据集的逻辑回归分类实践
函数库的导入
## 基础函数库
import numpy as np #
import pandas as pd
## 绘图函数库
import matplotlib.pyplot as plt
import seaborn as sns
四个特征变量分别为花萼长度、花萼宽度、花瓣长度、花瓣宽度。目标变量为鸢尾属下的三个亚属,分别是山鸢尾、变色鸢尾维吉尼亚鸢尾。通过对目标的四个特征变量的分析来对其进行分类。
数据读取/截入
##我们利用sklearn中自带的iris数据作为数据载入,并利用Pandas转化为DataFrame格式
from sklearn.datasets import load_iris
data = load_iris() #得到数据特征
iris_target = data.target #得到数据对应的标签
iris_features = pd.DataFrame(data=data.data, columns=data.feature_names) #利用Pandas转化为DataFrame格式
数据信息简单查看
##利用.info()查看数据的整体信息
iris_features.info()
##<class'pandas.core.frame.DataFrame'>
##RangeIndex:150entries,0to149
##Datacolumns(total4columns):
###ColumnNon-NullCountDtype
##----------------------------
##0sepallength(cm)150non-nullfloat64
##1sepalwidth(cm)150non-nullfloat64
##2petallength(cm)150non-nullfloat64
##3p