【Python】Autoviz: 一行代码搞定数据集探索并可视化

数据集各个特征有什么变化趋势、各个特征之间有何关系,我们可以借助Matplotlib、Seaborn等诸多工具来可视化展示,那么有没有一种工具能一次展示所有的关系了?

本文要介绍的Python工具Autoviz,一行代码即可完成对数据集所有关系的探索 (Exploratory Data Analysis,EDA)。

安装

pip install autoviz

一行代码搞定数据探索

本次以探索鸢尾花 (iris)数据集为例子,数据集详细介绍👉👉鸢尾花数据集详细介绍68a6aacb85865bcab8b8a43fe94ec3e8.pngautoviz使用,

from autoviz.AutoViz_Class import AutoViz_Class

#AutoViz实例化
AV = AutoViz_Class()

#一行代码实现数据探索
dft = AV.AutoViz(
    filename='/Users/xmy/Desktop/jobs/py/iris.csv',  #读入数据集,注意和dfte的区别
    sep=",",  #设置数据集分隔符,默认为逗号
    depVar="species",  #设置因变量
    dfte=None,  #传入一个pandas.DataFrame,如果filename已设置,此处为None,反之亦然
    header=0,
    verbose=0,  #可选0, 1或者2,设置图形的保存形式
    lowess=False,  #是否启用lowess回归,适合小数据量数据集,100,000行以上数据不建议用
    chart_format="svg",  #设置图形保存格式
    max_rows_analyzed=150000,  #设置数据集待分析的行数
    max_cols_analyzed=30,  #设置数据集待分析的列数
)

结果输出一部分为Dataset的简单介绍51fd69c208f81c48e8dcc92673c2de1d.png结果输出另一部分为大量可视化图表, 832abe7b19bd06138b91b4722e8382b3.png1fdc9980fa6e3f0bd3468e3e47bbe572.png6c8681e70b4c0ed8c898a1f07c6de0e6.png9086ddc2c61590b3ad6b78166d98bded.png4b9a3a5d2f6fb66ab5f5ecb651f51eea.png730f4c09d3a1df38b27336f08054a564.png以上整个过程仅仅需要4.226秒

No categorical or boolean vars in data set. Hence no pivot plots...
No categorical or numeric vars in data set. Hence no bar charts.
Time to run AutoViz \(in seconds\) = 4.226

###################### VISUALIZATION Completed ########################

参考:https://github.com/AutoViML/AutoViz


-END-

 
 

b62ade566100691417e95cc674aee08c.png

 
 
 
 
 
 
往期精彩回顾




适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑黄海广老师《机器学习课程》视频课

本站qq群851320808,加入微信群请扫码:

7197f8452070e255d843163a15db263a.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值