自动化数据分析框架比较—EDA Is All You Need

自动化数据分析框架比较—EDA Is All You Need

介绍

公众号:ChallengeHub

本文主要给大家介绍一些顶级的自动话EDA工具,并且通过实例展示具体效果。代码链接:https://www.kaggle.com/andreshg/automatic-eda-libraries-comparisson/notebook

AutoViz

AutoViz在众多免费软件Pythonic Rapid EDA Automation工具中脱颖而出,运行速度比较快,这比其竞争对手SweetViz或Pandas Profiling表现更好。

安装方式

!pip install git+git://github.com/AutoViML/AutoViz.git
!pip install xlrd
from autoviz.AutoViz_Class import AutoViz_Class
AV = AutoViz_Class()
dftc = AV.AutoViz(    
	filename='',     
	sep='' ,     
	depVar='target',     
	dfte=df,     
	header=0,     
	verbose=1,     
	lowess=False,     
	chart_format='png',     
	max_rows_analyzed=300000,     
	max_cols_analyzed=30
	)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Pandas Profiling

from pandas_profiling import ProfileReport
df = pd.read_csv('/kaggle/input/titanic/train.csv')
report = ProfileReport(df)
# Start of Pandas Profiling process
start_time = dt.datetime.now()
print("Started at ", start_time)
report

在这里插入图片描述

SweetViz

!pip install sweetviz
import sweetviz as sv
df = pd.read_csv('/kaggle/input/credit-card-customers/BankChurners.csv').head(2000)
advert_report = sv.analyze([df, 'Data'])
advert_report.show_html()

print('SweetViz finished!!')
finish_time = dt.datetime.now()
print("Finished at ", finish_time)
elapsed = finish_time - start_time
print("Elapsed time: ", elapsed)

在这里插入图片描述

D-Tale

!pip install dtale
import dtale
dtale.show(df)

官网链接:https://github.com/man-group/dtale

Dataprep

!pip install -U dataprep
from dataprep.eda import plot, plot_correlation
plot(df)

在这里插入图片描述

plot_correlation(df)

在这里插入图片描述

plot(df, "Customer_Age")

在这里插入图片描述

plot(df, "Customer_Age", "Gender")

在这里插入图片描述
[1]:Pandas Profiling GitHub - https://github.com/pandas-profiling/pandas-profiling
[2]: Dan Roth, AutoViz: A New Tool for Automated Visualization - https://towardsdatascience.com/autoviz-a-new-tool-for-automated-visualization-ec9c1744a6ad
[3]: George Vyshnya, PROs and CONs of Rapid EDA Tools - https://medium.com/sbc-group-blog/pros-and-cons-of-rapid-eda-tools-e1ccd159ab07
[4]: SweetViz - https://towardsdatascience.com/sweetviz-automated-eda-in-python-a97e4cabacde
[5]:DataPrep - https://sfu-db.github.io/dataprep/user_guide/eda/plot.html

欢迎扫码关注ChallengeHub公众号,讨论学习更多机器学习,数据分析等知识
在这里插入图片描述

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值