数据分析之鸢尾花简单分析

本报告详细分析了鸢尾花数据集,包括数据读取、特征处理(标准化、标签编码)、数据可视化(直方图、小提琴图、热图、折线图)以及多种模型的构建和评估(线性回归、随机梯度下降、岭回归、Lasso回归)。此外,还探讨了数据的聚类方法,如KMeans、层次聚类和DBSCAN。
摘要由CSDN通过智能技术生成

鸢尾花数据分析报告

1、读取数据

import pandas as pd

import numpy as np

pd.set_option('display.max_columns',20)

pd.set_option('display.max_rows',20)

df=pd.read_csv("D:\Test\iris.csv")

备注:sl:花萼长   sw:花萼宽   pl:花瓣长  pw:花瓣款  style:花的种类

简单描述数据的组成:每一列数据的大致统计:数据量,均值,方差,最小值,第一,二,三四分位数,最大值

 

2、数据清洗  主要去除异常值,空值,不合规数据数值  在本次分析报告中关于数据的清洗省略 假定所有数据均为合规数据

3、数据特征化处理

数据集结构描述:

特征处理:

关于 花萼长,宽,花瓣长,宽  进行标准化处理 StandardScaler

关于花的类型进行标签化: LabelEncoder  将花的种类编码为1,2,3

分别代表3种类型的花

 

4、数据可视化描述

在做这部分对数据结构进行分解  花的类型作为标注

#绘制直方图:表示每个数据出现次数大致统计情况

x.hist(figsize=(10,10),bins=150,alpha=0.8)

  • 5
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值