数据分析之鸢尾花简单分析

最新推荐文章于 2023-08-05 08:00:00 发布

Ahpubx

最新推荐文章于 2023-08-05 08:00:00 发布

阅读量6.3k

点赞数 5

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Aberton/article/details/101272087

版权

本报告详细分析了鸢尾花数据集，包括数据读取、特征处理（标准化、标签编码）、数据可视化（直方图、小提琴图、热图、折线图）以及多种模型的构建和评估（线性回归、随机梯度下降、岭回归、Lasso回归）。此外，还探讨了数据的聚类方法，如KMeans、层次聚类和DBSCAN。

摘要由CSDN通过智能技术生成

鸢尾花数据分析报告

1、读取数据

import pandas as pd

import numpy as np

pd.set_option('display.max_columns',20)

pd.set_option('display.max_rows',20)

df=pd.read_csv("D:\Test\iris.csv")

备注：sl：花萼长 sw：花萼宽 pl：花瓣长 pw：花瓣款 style：花的种类

简单描述数据的组成：每一列数据的大致统计：数据量，均值，方差，最小值，第一，二，三四分位数，最大值

2、数据清洗主要去除异常值，空值，不合规数据数值在本次分析报告中关于数据的清洗省略假定所有数据均为合规数据

3、数据特征化处理

数据集结构描述：

特征处理：

关于花萼长，宽，花瓣长，宽进行标准化处理 StandardScaler

关于花的类型进行标签化： LabelEncoder 将花的种类编码为1，2，3

分别代表3种类型的花

4、数据可视化描述

在做这部分对数据结构进行分解花的类型作为标注

#绘制直方图：表示每个数据出现次数大致统计情况

x.hist(figsize=(10,10),bins=150,alpha=0.8)

最低0.47元/天解锁文章

关注

5
点赞
踩
46

收藏

觉得还不错? 一键收藏
0
评论
数据分析之鸢尾花简单分析

鸢尾花数据分析报告1、读取数据import pandas as pdimport numpy as nppd.set_option('display.max_columns',20)pd.set_option('display.max_rows',20)df=pd.read_csv("D:\Test\iris.csv")备注：sl：花萼长 sw：花萼宽 pl...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。