回归问题：运用逻辑回归分析详解鸢尾花数据

最新推荐文章于 2024-07-15 14:46:23 发布

sevieryang

最新推荐文章于 2024-07-15 14:46:23 发布

阅读量4.3k

点赞数 2

分类专栏： # excel和python数分文章标签：逻辑回归分析鸢尾花数据实战项目机器学习

本文链接：https://blog.csdn.net/qq_42442369/article/details/86568441

版权

项目背景：IRIS （IRIS数据集）

Ref：https://www.sohu.com/a/197631437_752099

数据来自大名鼎鼎的Kaggle网站,里面有很多好玩的数据集. 下面就是Iris数据:
在这里插入图片描述
Iris也称鸢尾花卉数据集，是一类多重变量分析的数据集。通过花萼长度，花萼宽度，花瓣长度，花瓣宽度4个属性预测鸢尾花卉属于（Setosa(山鸢尾)，Versicolour(杂色鸢尾)，Virginica(维吉尼亚鸢尾)）三个种类中的哪一类。
在这里插入图片描述
这个数据集，仅有150行，5列。该数据集的四个特征属性的取值都是数值型的，他们具有相同的量纲，不需要你做任何标准化的处理，第五列为通过前面四列所确定的鸢尾花所属的类别名称。

type(iris)
# sklearn.utils.Bunch

数据集长这样：
在这里插入图片描述

四个特征属性，引自数据集：
Number of Attributes: 4 numeric, predictive attributes and the class\n :Attribute Information:\n - sepal length in cm\n - sepal width in cm\n - petal length in cm\n - petal width in cm\n
花萼长度，宽度；花瓣长度，宽度

花萼是啥？？？？下图：
在这里插入图片描述
其它比较流行的数据集还有Adult,Wine,Car Evaluation等。
中文名鸢尾花卉数据集外文名 Iris data set

思路

导入模型。调用逻辑回归的LogisticsRegression()函数
fit()训练。调用fit(x, y)的方法来训练模型，其中x为数据的属性，y为所属类型。
predict()预测。利用训练得到的模型对数据集进行预测，返回预测结果。

程序

# 导入模块
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression

最低0.47元/天解锁文章

sevieryang

关注

2
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
回归问题：运用逻辑回归分析详解鸢尾花数据

# 导入模块import matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets import load_irisfrom sklearn.linear_model import LogisticRegression# 读入数据iris = load_iris()X = iris.data[:, :2]Y =...
复制链接

扫一扫

专栏目录