介绍一个效率爆表的探索性数据分析插件

本文介绍了D-Tale这款强大的数据集探索性分析工具,它可以帮助用户快速理解数据集并进行筛选、排序、重命名、删除列等操作。此外,D-Tale还提供了统计分析、缺失值检查、相关性分析和多种图表可视化功能,方便进行数据预处理和洞察。通过设置选项,用户可以调整界面风格和尺寸,满足个性化需求。
摘要由CSDN通过智能技术生成

f44c1a5d2b88d86fab9b5b8416231482.gif

作者 | 俊欣

来源 | 关于数据分析与可视化

今天给大家介绍一款十分强大的数据集探索性分析插件,D-Tale,供我们分析和了解数据集的基本情况,并且支持对数据进行进一步的可视化分析,首先我们先要安装好该模块。

pip install dtale


5e7c026a1ca7b8eeb4dd1706225967a9.png

用D-Tale插件打开数据集

我们在D-Tale中打开数据集,代码如下

import dtale
import pandas as pd

df = pd.read_csv(r'gapminder_full.csv')
d = dtale.show(df)
d

output

05825d56e0a6db1e1a50fc334893ffd4.png

数据集来源于Kaggle,当中包含了全世界每个国家的人口总数、人均GDP以及人口寿命等数据,下面我们就来尝试使用一下该插件的各项功能吧。

a61619bf5a3591ef17dacf79a412e3aa.png

筛选数据

我们来看一下如何用D-Tale插件来进行数据的筛选,例如我们想要筛选出年份是2002年的内容,步骤如下

5573aa86c331ba7dad7dbd8876c9d4f8.gif

我们点击Action当中的Custom Filter,然后填上对应的year==2002,然后点击Apply即可实现,当然我们还可以点击对应的某一列,然后鼠标拉到底,同样也能进行操作,步骤如下

a55b133dc1ee641095277db4db4d6028.gif

ddc40a965aa0173708fa2c4a0df2d9c4.png

其他的数据基本操作

我们同样地可以对数据进行排序,在我们点击到某一列的时候,会弹出如下的选项框

a8463bab03fd1f0830c67ee4cae45346.png

其中就包括了对数据进行排序的按钮,例如我们对gdp_cap这一列进行降序排序,步骤如下

b2e24020c13752a44b6542d3f6556e73.gif

我们还能够对数据集当中的每一列进行重命名,使用的是Rename这个选项按钮,步骤如下

2ce399ac1f6cdb4358fe911c1acb5c77.gif

那么如果是想要删除某一列的话,对应的则是Delete这个选项按钮了,相当于是Pandas当中的drop方法

而当我们点击Describe这个按钮之后,会出现针对某一列的统计性分析,如下图所示

2ba6fbe091b15491e30ecafc32a14f98.png

并且可以通过图表可视化的形式来更加直观地展现统计分析的最终结果

8c6c15910919adc6588f8eac9d93d98b.png

如果我们要是想要查看各个特征变量之间的相关性,D-Tale插件会通过热力图的方式来呈现,步骤如下

b2a43d4c74afe630456b9b89078237b6.gif

a47d934f8eb065517db4dea0dd521156.png

图表的可视化功能

该插件还能够进行图表的绘制,我们点击图中Visualize按钮,并且在下拉框中选中Charts这个按钮

6e9e31fd52b74c46e3cde5e14ae64ba2.png

接下来我们便是进入到可视化的界面了,如下图所示:

991cff54c3dcf1ede78185e42a1e67dd.png

这里包含了折线图、散点图、直方图、词云图、热力图等各种图表的绘制,我们只需要指定好X轴上放置的变量、Y轴上放置的变量以及相对应的统计的方式即可,感兴趣的读者可以空的时候加以尝试

c29d9f238c3b94cf47a8869b3728d646.png

要是数据集当中存在缺失值,同样也可以通过图表的形式来展现,因为之前引用的数据集不存在缺失值,因为这里更改成另外的数据集来操作,步骤如下图所示

52da396ea0dd5e19d8ff294fbb13d5b7.gif

b1896d88de8cc08170eb1d09bb7f5157.png

设置选项

我们来看一下工具栏中的setting按钮,点击之后再出现的下拉框中我们可以对界面设置是否为“深色模式”,以及对语言也可以进行设置

e2c231e4d0837edc9070828f9111eadd.png

界面的宽度和高度我们要是觉得不行也能进行调整

dbd0d99e764b476fe47df0d7c49b1902.png

aa1c5892d7d82769d0215fc8d6c2b088.png

分组统计


我们点击图表上方工具栏中的Actions按键,在下拉框中点击Summarize Data按键,出现如下的界面

8d439904df36754c8d1791b05ce20f22.png

我们点击GroupBy按钮,例如我们将要针对continent列来进行每一个大洲人均寿命的统计,步骤如下

0092df8cb6d8fab297c46ce35fe4eda2.gif

最后我们可以导出上述操作的代码,步骤如下

e0be0ad58701e5263b9e4f3c1686c534.gif

897070c6308340523f279d92f281d88e.gif

技术

YYDS!Python实现自动驾驶

资讯

何同学又上热搜了,这次为什么?

技术

一起用Python做个AI出牌神器!

技术

用Python打造一个语音合成系统

96220b4810ca4a3bea8ade7e7ee550da.png

分享

0f1d84f85ad816acb3818bfe998de8c3.png

点收藏

6e386ce73ff67f499ebf9704338aafc5.png

点点赞

88648d907ceac8dd2b803ad2e5280dd1.png

点在看

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值