机器学习之逻辑回归
基于鸢尾花(iris)数据集的逻辑回归分类实践
鸢花数据集(iris),该数据集一共包含5个变量,其中4个特征变量,1个目标分类变量。共有150个样本,目标变量为 花的类别 其都属于鸢尾属下的三个亚属,分别是山鸢尾 (Iris-setosa),变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。包含的三种鸢尾花的四个特征,分别是花萼长度(cm)、花萼宽度(cm)、花瓣长度(cm)、花瓣宽度(cm),这些形态特征在过去被用来识别物种。
逻辑回归的简单介绍
虽然名字中带有回归,但是它是一种分类算法。其算法实现简单,可解释性强。其缺点是容易欠拟合,分类精度不高。其本质是一个线性的分类器,不能处理较为复杂的数据,常常作为baseline。
一般过程
Step1:库函数导入
Step2:数据读取/载入
Step3:数据信息简单查看
Step4:可视化描述
Step5:利用逻辑回归模型进行训练和预测
- 详细整个逻辑回归在鸢尾花集上的分类实现,见天池实验。