用Python的dtale库进行数据探索

dtale库简介 /Profile/

数据分析是任何数据科学项目中最重要的部分。分析数据可为我们提供有关数据的一些重要而优美的见解。Python中有许多库可以执行分析,例如Pandas,Matplotlib,Seaborn等。

最近,开发人员引入了新的“ dtale”库,以更少的代码执行分析。

D-Tale是Flask后端和React前端的结合,为我们提供了一种查看和分析Pandas数据结构的简便方法。它与Jupyter笔记本和Python终端无缝集成。当前,此工具支持诸如DataFrame,Series,MultiIndex,DatetimeIndex和RangeIndex之类的Pandas对象。

让我们深入了解如何在Python中使用此dtale库!

1.为dtale设置环境

conda create -n dtale python
conda activate dtale

现在,我们首先需要在各自的环境中安装dtale库。

pip install dtale

2.使用dtale进行探索性数据分析

现在,让我们使用dtale深入研究我们的数据。

import dtale   ## importing D-Tale library

导入Seaborn将有助于我们加载数据集。Seaborn有许多默认数据集。我们将使用“planets”数据集进行以下分析。

import seaborn as sns
df=sns.load_dataset(‘planets’)
dtale.show(df, ignore_duplicate=True)

运行上述代码后,用户可以访问下面的交互式表以执行多个操作并可视化数据集。

在左上角显示数据集的列数和行数(在这种情况下,为1035行和6列)

D-Tale以与pandas相同的方式向我们显示数据。唯一的不同是,左上角的菜单使我们可以对数据进行很多处理。

单击任何列标题会打开一个下拉菜单,该菜单为我们提供了对数据进行排序并根据需要准确显示的选项。



3.探讨菜单选项

3.1描述选项

在此菜单中,我们可以找到的最有趣的选项是Describe(描述),它显示了所选列的统计分析结果;Column Analysis(列分析),显示了所选列的直方图。

选择所需的列后,我们将能够在屏幕中间看到三个主要选项“Describe”,“Histogram”和“Categories”选项。Describe选项为我们提供有关所选列数据的统计信息,而Histogram则为相应的图形表示。第三个选项是“Categories”,因为我们可以从“Category Breakd”中选择X轴变量。

该库的另一个重要功能是在右上角的“Code Export”选项。此功能提供了特定输出的代码。同样,在“Describe”菜单中,我们将能够在底部看到所有异常值和“唯一性”值。



3.2尺寸/主菜单:

在D-Tale主菜单中,将找到D-Tale中所有可用的选项。这就是D-Tale的所有魔力所在。通过单击DataFrame左上角突出显示的播放按钮,将能够查看所有选项,如下图所示。

D-Tale提供执行简单操作(例如排序,过滤和格式化)的功能。

重复选项是主要的帮助,它可以帮助我们删除数据集中的重复值,并且“自定义过滤器”选项可以将过滤器应用于列。用于数据可视化的最重要的选项是相关性,图表和热图。


3.3相关性

在主菜单中单击“Correlations”选项后,它将重定向到另一个“Correlations”选项卡。在这种情况下,我们必须在“View correlation for”下拉列表中选择变量。在下拉列表中选择值之后,如果单击“ Correlation”值,将能够看到散点图中两个变量之间的Correlation的直观表示,如下图所示。



3.4图表

主菜单中的图表选项可帮助我们可视化所有不同类型的图表(折线图,条形图,ScatterPlot,圆形图,Wordcloud,Heatmap,3D ScatterPlot和Surface)。D-Tale的神奇功能之一是交互式绘图,它还支持3D图表和带有group by和聚合功能的动画。它非常有用,因为可以使用不同的图表来可视化任何类型的关系。下图显示了我们可以使用D-Tale中的Chart选项生成的一些图表示例。

散点图

词云图

最后,最理想的选择之一是Heatmap。它根据每个单元格的值在数据表中显示颜色。可以使用b中的export CSV选项将图形数据导出到CSV文件。

热图


4.结论

在本文中,我们了解了D-tale如何节省我们的时间和精力来创建具有视觉吸引力和洞察力的EDA报告。该EDA报表工具在分析和可视化所有类型的数据集时非常有用。D-Tale是数据科学社区中最受欢迎的图书馆之一。D-Tale有很多选项,可以帮助我们从统计角度了解数据的趋势,因此请继续探索。

本文为转载分享&推荐阅读,若侵权请联系后台删除

-----------------

长按识别下方二维码,并关注公众号

1.回复“PY”领取1GB Python数据分析资料

2.回复“BG”领取3GB 名企数据分析报告

  • 2
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值