1999-2017年中国各省旅游外汇收入分析及可视化(附代码及数据)

首先,数据来源于国家统计局国家数据查询页面,如下:

 

640?wx_fmt=jpeg

然后通过爬虫把数据抓下来(当然,你通过选点页面,复制黏贴也可以做到),爬虫脚本见文章最后的地址,然后我也就不解释如何实现的了,因为——

 

640?wx_fmt=jpeg

 

大家也可以直接用我给出来的数据,数据地址直接看最后……

 

这段时间,需要参与一个有关时间序列分析的项目,所以用这种20年数据来练练手,找找感觉的。

 

不同省份的旅游外汇收入,基本上能够反映出中国改革开放和对外交流的程度,我们可以从这些数据中去发现一些有趣的问题,有兴趣研究的同学可以深入研究,本文仅介绍几种可视化的技术,首先,对于时序分析,当然第一分析图就是折线图咯,所以我就做了一个默认效果的折线图:

 

640?wx_fmt=jpeg

相信大家看到,感觉和我是一样的:

 

640?wx_fmt=jpeg

根本就没法看不是,也不知道谁是谁,所以,这种数据打堆放一起的时候,还是有一个交互效果比较好,比如我可以采用pyecharts来做折线图:放出动图如下:

 

640?wx_fmt=gif

如果你是javascript高手的,这种当然是小儿科,but,我们是用Python来做,所以百度家的Echarts号称中文JS免费第一可视化工具包,还是做了很多好事滴,特别是改造成Python的之后,对于我这种JS盲,那是绝对的福音啊。

 

代码还是见文末地址。

 

无聊的时候,我还做了一个相关性分析,得到了一个很有意思的结果:

 

640?wx_fmt=jpeg

甘肃这是要逆天啊……所有省份之间的旅游收入,都是正相关,但是甘肃与其他所有省份的旅游情况,恰恰是负相关,具体看看甘肃的情况: 

640?wx_fmt=jpeg

恭喜甘肃,获得全国旅游外汇收入波动最大省份……

 

以上都是属性可视化,下面介绍一种有关地图的可视化模型:分位数地图,先看图:

 

640?wx_fmt=jpeg

分位数地图,是利用箱线图的分位数方法,将数据分成六类(不算缺失值),然后映射到地图上面的方法,这本来是geoda的拿手技术,比如我用geoda实现中国2009年人口的分位数地图如下: 

640?wx_fmt=jpeg

现在我们可以用Python来进行实现了,实现的方法如下:

 

640?wx_fmt=jpeg

640?wx_fmt=jpeg

 

具体代码,可以从文末地址下载,最后,我们分别来做几个不同时间段的分位数地图看看:

 

首先看看2000年:

 

640?wx_fmt=jpeg

2000年的时候,宁夏是异常低值,而北京江苏都是异常高值……2000年时候的分布,基本上与经济情况相仿。

 

然后看看2008年:

2008年北京奥运年,所以北京依然是异常高值,宁夏依然是异常低值,但是浙江和福建对调了。

 

640?wx_fmt=jpeg

 

2012年:北京的旅游收入增长放缓,进入了第二梯队,江苏和广东依然异常高值。

640?wx_fmt=jpeg

2016年:异常高值只剩下了广东,而异常低值变成了甘肃。

 640?wx_fmt=jpeg

最后重复以前的一个观点:可视化不是分析结果,可视化只是数据本身表现出来的某些特征,这里面的分析结论以及后面的意义,就需要各位同学和专家们深入探索和研究了。

 

最后,代码与数据的位置如下:

 

https://github.com/allenlu2008/PythonDemo

 

里面的014时序分析,欢迎大家下载。

  

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

虾神说D

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值