一、分析目的及数据源简介
本案例可以直观地看出,我国人口在各省之间的流动特点,并据此了解各省之间的相关性。
本次学习使用的数据为1985至1990年(好久远呀)的人口迁移数据。数据样式如下:
其中from 为流出省份,to为流入省份,count为人口数量。
二、数据展示
1、展示流出流入数据方向
在实际研究中,我们为了观察主要特征,往往采取抓大放小的措施。在这里也是一样,对于count较小的数据,不作为我们本次的研究对象。此次查看的数据为迁移次数大于80000的记录,所以导入方式如下:
【脚本】
data = pd.read_csv(r'D:\population.csv', encoding='GBK')
#将大于8万的数据转成list以备地图上展示
result = data[data['count']>80000][['from', 'to']].values.tolist()
geo = Geo()
geo.add_schema(maptype='china')
#将result数据显示在地图上,并确定了线型为曲线
geo.add('1985~1990人口迁移图', result, type_=ChartType.LINES, linestyle_opts=opts.