python拿什么做可视化界面好_划重点,经济学学Python需要学哪些内容?数据可视化呈现必知必会的知识点...

说起数据可视化, Stata 用户想到的可能是 graph命令, R 用户想到的可能是ggplot 命令,而第三库丰富的 Python 则会提供给你更多的选择。对于经济学专业的同学们,在实际学习中比较常用的数据可视化需求,其实有两类情况:一种是在描述性统计中描述数据的概括,为后续的实证分析做支持;另一种是在实证分析中,为了让自己的分析更“出彩”或者是用了某些新的方法(例如机器学习),能够更加形象地展示计量结果而做数据分析的可视化呈现。

(一)描述性统计中可用的 Python 可视化包

对于第一类的可视化需求,一般流程多是通过诸如 Excel 一类的软件完成的,而当你学会了 Python 以后,你可以非常轻松地利用 matplotlib 库,来实现基础的数据可视化。

1. matplotlib

8798272eeffa7ddd6d49aa1810871f1d.png

matplotlib 是 Python 数据可视化的基础,众多的可视化第三包都是基于 matplotlib 派生的。如果你学习了 Pandas,会发现,Pandas 其实也可以做数据呈现,通过 dataframe.plot() 的代码,就能够呈现出数据了。Pandas 的可视化呈现就是在调用 matplotlib。

也许你已经发现了,绝大多数推荐 Python 数据可视化的文章,都会将它写在第一位。这也从侧面反映了其重要性。学好 matplotlib 已经能够满足绝大多数的数据可视化需求了,在学完基础的语法及用法后,推荐去参考下面的官方示例链接,根据示例再进一步地提高自己的代码水平。

官方地址:
https://matplotlib.org/​matplotlib.org
官方示例:
Gallery - Matplotlib 3.1.3 documentation​matplotlib.org
a9e0825249de48e54c8461074730bda3.png

08d828a392fe468da4f14a1c2846df28.png
“官方示例页面的每一张图片,点击后都能看到详细的 Python 代码。还有什么比这样的学习方式更快捷高效的呢?

2. Seaborn

96bb52718a1b4f8e826b72c92e61c0e1.png

我们要介绍了的第二个可视化包,同样名声在外,许多 Python 老鸟更倾向于使用 Seaborn 来绘制他们的图表。Seaborn 也是基于 matplotlib ,它对 matplotlib 进行了一定的封装,让你能够更加快速上手的同时绘制出更美观的图表。当然,封装意味着一定自由度的缺失,如果你想更自主地作图,你依然可以选择使用 matplotlib。

同样,下面官方示例的链接中给出了每一种图表具体的 Python 的代码。

官方地址:

seaborn: statistical data visualization​seaborn.pydata.org

官方示例:

Example gallery - seaborn 0.10.0 documentation​seaborn.pydata.org

848bcb167b63ce44deddd8fabf1789f9.png

其他好用,并且推荐尝试的可视化包

ggplot2:什么?ggplot 不是 R 的包吗?是的,ggplot2 是 R 语言上著名的可视化包,但是,现在你可以在 Python 上使用它了。语法结构会让 R 语言的用户倍感亲切。

Bokeh:与 ggplot 的代码理念相似的制图包,同样推荐给接触过R语言的用户。

Plotly:Plotly 是一个拿过年度10佳的开源项目,但是要使用它,你首先需要在他们的官网:https://plot.ly/python/,拿到一个 API 密钥才能看到你做的图。Plotly 有比较好的用户界面,当你做完图后,可以通过鼠标点点的方式进行颜色、数轴的修改。

4bf0a289dcbf8dd2b7dd6c36f005520e.png
科普园地 /Science Park

API:即应用程序编程接口(Application Programming Interface),所谓API就是软件封装后留下了的接口,你可以类比为一个插座,当你用正确的插头插到这个接口(API)时,就成功通电了。上例中,Plotly 这块第三包的使用方式,就是需要你在代码中填入一个从官方获取的密钥,这个密钥标示了你的个人身份,就好像身份证一般。通过这个密钥,Plotly才会开放API给用户绘制图表。不然,仅仅靠代码,是没办法看到可视化的结果的。

pyecharts:来自国内 百度 的良心产品,源自 echarts 项目(一个JavaScript项目)。所以在绘图中的一些定制项会非常类似 JavaScript 的程序理念。相对而言,显得不那么像 Python 的逻辑。但是作为用户,参照文档依然能够实现比较好的数据可视化效果。

(二)实证分析、机器学习方法中可用的可视化包

接下来要说的是一些在实证分析中可能会用到的可视化包。首先需要明确的是,上述提到的可视化包,都可以在论文的任何地方出现。

1. matplotlib + 其他

Matplotlib 广泛的在许多计量、机器学习包中被使用。因此,在许多情况下,通过计量、机器学习库 + matplotlib 就能够实现很好的可视化效果。

例如 statsmodels + matplotlib:

6b766557f126c45d45eb9be056ae3e56.png

再例如:sklearn + matplotlib:

86be7a830f8a49c7733dc33514cd218f.png

2. Yellowbrick 机器学习中的可视化呈现

0179ad162bd021c1119d77023fd243bf.png

可视化呈现机器学习,帮助你更好地做模型的选择与参数的调整。Yellowbrick 是一个能够帮助你查看机器学习模型训练结果的库,能够呈现:

1、特征的可视化
2、分类的可视化
3、回归可视化
4、聚类可视化
5、模型选择可视化
6、文本可视化

在众多的机器学习问题中都帮助到用户,更直观地观察训练结果。你可以通过官方示例的地址,查看 Yellowbrick 是如何呈现这些数据集的。

官方地址:

https://www.scikit-yb.org/​www.scikit-yb.org

官方示例:

Gallery - Yellowbrick v1.0.1 documentation​www.scikit-yb.org

6753589ee1c9cb6d78f2ff1efe530bf1.png

3. 地图可视化库:folium 与 Basemp

folium 和 Basemp 都是在python中较多被使用的地图可视化库。Folium 中有较多的地图类型可供使用,例如下图这种风格的地图:

113a20ee9920512f25e3b21e9d77e3e7.png

你可以通过 folium 创建热力图、设色图,甚至可以在地图上绘制各种图标。他们的官方示例存放在了 jupyter notebook 中。

项目地址:

Folium - Folium 0.10.1 documentation​python-visualization.github.io
9d35856210ae6a31db47bf6f4c4180c5.png

官方示例:

Jupyter Notebook Viewer​nbviewer.jupyter.org

Basemp 提高了成熟的静态地图绘制的功能。在地理信息读写、坐标映射、空间坐标转化与投影等方面做得都比较好。并且它可以使用常规的地图素材数据源(shp)作为底图进行叠加绘图,方便用户的使用。

e9e1b98141d5aa3cda3a71f613cb537c.png

项目地址:

Welcome to the Matplotlib Basemap Toolkit documentation​matplotlib.org

官方示例:

Plotting data on a map (Example Gallery)​matplotlib.org
f1ba2b4dc59ecafd108e668da449bed2.png

最后简单小结一下,对于经济学专业的学生来说,用 Python 画图,如果只是简单的绘图需求,那么使用 Seaborn 能够快速绘制出好看的图表,当然如果你能够正确地申请到 Plotly 的密钥,我们同样推荐使用 Plotly。而对于想要用 Python 实现更多可视化需求的用户,那么学好 matplotlib 必不可少。

文章首发于公众号 数据Seminar

数据呈现丨划重点 ! 经济学学Python 需要学哪些内容?——数据可视化呈现必知必会的知识点​mp.weixin.qq.com
7e0772385e54f6ca345987d687d602a2.png

更多内容关注公众号 数据Seminar

a42af591730b50f64665bb50eb0dd707.png
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,以下是一个Python+pandas+matplotlib的数据分析与可视化案例。 这个案例涉及到一个名为"World Happiness Report"的数据集,该数据集包含了157个国家的幸福指数及其对应的各项因素数据,例如经济、社会、健康等。 首先,我们需要导入相关的库和数据集: ```python import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('world_happiness_report.csv') ``` 接下来,我们可以先看一下数据集的基本信息: ```python print(df.head()) print(df.info()) ``` 然后,我们可以通过绘制柱状图来比较不同国家的幸福指数: ```python plt.figure(figsize=(15, 10)) plt.bar(df['Country'], df['Happiness Score']) plt.xticks(rotation=90) plt.title('World Happiness Report') plt.xlabel('Country') plt.ylabel('Happiness Score') plt.show() ``` 接着,我们可以通过散点图来探究幸福指数与经济因素之间的关系: ```python plt.figure(figsize=(10, 8)) plt.scatter(df['Economy (GDP per Capita)'], df['Happiness Score']) plt.title('Happiness Score vs. GDP per Capita') plt.xlabel('Economy (GDP per Capita)') plt.ylabel('Happiness Score') plt.show() ``` 最后,我们可以通过热图来展示不同因素对幸福指数的影响情况: ```python factors = ['Economy (GDP per Capita)', 'Family', 'Health (Life Expectancy)', 'Freedom', 'Trust (Government Corruption)', 'Generosity'] corr_matrix = df[factors].corr() plt.figure(figsize=(10, 8)) plt.imshow(corr_matrix, cmap='coolwarm', interpolation='none') plt.colorbar() plt.xticks(range(len(factors)), factors, rotation=90) plt.yticks(range(len(factors)), factors) plt.title('Correlation Matrix') plt.show() ``` 以上就是一个简单的Python+pandas+matplotlib数据分析与可视化案例,希望对你有帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值