Python数据分析师的最佳伴侣 — PyGWalker

概要

数据分析师三件套:Python、Alteryx、Tableau(或Power BI)。

Python不用说,啥都能干。Alteryx主要用于数据清洗和数据准备。Tableau则主要用于数据可视化。

有的数据分析师只喜欢用Python,不喜欢Alteryx和Tableau等图形软件。

不想用Alteryx还好说,毕竟用Python做数据清洗、分割等准备工作也是数据分析师的基本功。然而想用Python实现Tableau/PowerBI的效果就不容易了,不管采用Matplotlib、Seaborn,还是Plotly,要达到一定的效果,都比较复杂繁琐。

不过,有了PyGWalker,Python数据分析师就又多了一把利器,可以更加理直气壮地“只用Python”了。

可以这么理解,PyGWalker就是嵌入Jupyter Notebook的Tableau,而且使用非常方便、超级简单。

PyGWalker的安装使用

用Pip安装即可:

pip install pygwalker

使用非常简单,只需写两句话,一句话导入库,一句话调用你的dataframe即可:

import pygwalker as pyg
pyg.walk(df)

当然,df是自己要先定义好的。下面是一个完整的示例代码:

import pandas as pd
import pygwalker as pyg

data = {
    '国家': ['China', 'India', 'USA', 'Indonesia', 'Pakistan', 'Brazil', 'Nigeria', 'Bangladesh', 'Russia', 'Mexico',
                'Japan', 'Ethiopia', 'Philippines', 'Egypt', 'Vietnam', 'DR Congo', 'Iran', 'Turkey', 'Germany', 'Thailand'],
    '人口': [1444216107, 1407563842, 336997624, 276361783, 240485658, 213993437, 223804632, 173183377, 144320000, 128649565,
                   123961000, 126527060, 115559009, 111200400, 99678800, 108407721, 86022760, 85561976, 83467000, 71697146],
    '平均收入': [10500, 2300, 62000, 4200, 1400, 7200, 2000, 1900, 11500, 9100,
                   43000, 2300, 3800, 3200, 2500, 800, 5400, 9700, 46000, 7200],
    '平均寿命': [77.5, 70.2, 79.1, 72.8, 67.2, 75.7, 55.5, 73.4, 72.6, 76.6,
                        84.6, 67.0, 71.2, 71.0, 76.4, 60.4, 75.9, 78.6, 81.0, 77.2]
}

df = pd.DataFrame(data)
pyg.walk(df)

注意:如果你先写好了全部或部分代码,然后再安装的PyGWalker包,则有可能需要关闭你的Notebook文件再重新打开并执行,才能得到下面的图形界面。

PyGWalker图形界面使用简介

在Jupyter中运行上面的示例代码,将在输出单元获得类似于Tableau的一个图形界面。运行含pyg.walk的单元格后,界面默认位于Visualization标签;但这里我们从Data标签讲起,点击Data标签,看到如下界面:

pygwalker-data
这就是你的数据了,你可以理解为pyg.walk(df)代替了这个位置常见的一句话df.head(),并比后者提供了更多的信息,例如每列数据的分布或数量。

现在我们回到Visualization标签,将看到一个尚没有任何图表的作图界面,类似于Tableau:

在这里插入图片描述
然后我们把左侧的数据列拉到右侧相应的X坐标栏和Y坐标栏,就可以显示图表了,例如我们把国家拉到X轴,把人口拉到Y轴,就会显示每个国家人口的直方图:

在这里插入图片描述
中间那一栏是对图表的筛选和修饰,例如上图中,我们把国家拉到了color这一格,所以图表就按国家进行了染色。

如果点击工具栏的第7、第8个标签,将显示升序或降序排列的数据柱。

所显示的图表是交互式的。当把鼠标放到图表的某一个实体上,例如上面把鼠标放到China的柱子上,就会显示中国的人口数。如果点击该柱子,还可以进一步操作,例如解释数据和查看原始数据。

图表类型可以在工具栏第4个即橙色标签那里可以修改。默认是Auto(自动),即根据数据自动识别最佳的图表类型,你可以根据自己的需要改成指定的类型。

注意:默认情况下图表比较小,可以通过工具栏第10个图标修改。

可以制作多个图表。点击左上角的+New标签增加新的图表。图表的名字也可以在这里修改。下面是我们增加的另一个图表:

在这里插入图片描述
这里,我们使用了气泡图,并以人口数量作为气泡大小的依据 — 把人口拉到中间的Size修饰器中即可。

以上就是一些示范。可以看到,PyGWalker非常简单易用。

Q&A

  1. 为何我运行含pyg.walk(df)的单元格后,啥都没发生?

    :可能是因为你先写代码,后安装PyGWalker包的原因。可以关闭代码文件再重新打开,再执行。

  2. 为何我的图形界面为何是黑色?

    :可能是因为你的电脑的主题色是黑色系。PyGWalker默认是跟随电脑系统的主题。你可以点击其界面左下角的图标,修改为白色或黑色。

  3. 如何修改图表的色系?

    :工具栏中间偏右有一个齿轮设置图标,可以点击进去修改。

  4. 如何修改坐标轴刻度范围?

    :貌似还不能修改。

  5. 如何在一个图表标签中同时显示多个图表?

    :可以把多个系列数据拖入到Y轴栏,即可在一个界面自动形成多个图表。但如果你想要在一个坐标系中显示多系列数据,或者使用左右双纵坐标轴的话,貌似还不行。

小结

以上就是对Python数据分析师的最佳伴侣 — PyGWalker的介绍。

喜欢的话记得点赞哦。

  • 11
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值