1.项目说明
通过全国2013-2016城市间投融资信息数据,分析资本在各城市间的流动情况.
2.项目具体要求
1.查看全国城际控股型投资关系
要求:分别筛选出“同城投资”、“跨城投资”的TOP20,比较一下两类投资的数据分布
2.2013-2016年全国跨城市资本流动情况
要求:
① 结合“中国城市代码对照表.xlsx”数据,给2013-2016年“跨城投资”的汇总数据添加城市的经纬度
② 通过2013-2016年“跨城投资”的汇总数据,在gephi中绘制“城市关系图”
③ 通过2013-2016年“跨城投资”的汇总数据,在echarts中绘制“全国跨城市资本流动OD图”
3.深挖跨城市资本流动:钱从哪里来,到哪里去?
要求:
① 近四年对外控股型投资笔数最多的10个城市是哪些?
② 近四年吸引对外控股型投资笔数最多的10个城市又是哪些?
③ 从2013年到2016年,资本流动两大阵营的变化趋势:“北上深阵营”、“本地化阵营”
3.实现思路:
1.根据投融资信息数据,可知投资关系分为’同城投资’和’跨城投资’两种,因此可比较这两种投资的分布,以及随年份的变化。
投资的分布可以分别筛选出’同城投资’和’跨城投资’的数据,然后根据’投资方所在城市’和’融资方所在城市’进行分组求和,
然后绘制柱状图即可得到两种投资类型的分布情况。
随年份的变化可以循环筛选并绘制各个年份的’同城投资’和’跨城投资’的柱状图,4*2个子图,一行作为一个年份两种类型的比较.
2.分析全国跨城市资本投资关系可以使用Gephi进行数据关系分析,可以得到基于投资数据的’城市关系图’,可以清晰看到各城市间的
投资关系。城市间的资本流动可以通过绘制OD图来分析,可以非常直观而全面的了解资本在各个城市的流动情况。
3.深入分析城市间资本流动,从两个方面入手,一方面分析向外投资的城市的投资数据,另一方面分析融资城市的融资数据,分析哪些城市
投资较多,哪些城市融资较多,取数据TOP20绘制柱状图。并分析主要投资城市资本是如何扩张的。
4.实现过程:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')
# 不发出警告
from bokeh.io import output_notebook
output_notebook()
# 导入notebook绘图模块
from bokeh.plotting import figure,show
from bokeh.models import ColumnDataSource,HoverTool
# 导入图表绘制、图标展示模块
# 导入ColumnDataSource模块
#设置默认目录
import os
os.chdir(r'D:\IT\python数据分析师\项目12')
#筛选出'同城投资','跨城投资'的TOP20数据
data = pd.read_excel('data.xlsx') #读入excel 数据
tc_data = data[data['投资方所在城市']==data['融资方所在城市']] #筛选同城投资数据
tc_sum = tc_data.groupby(['投资方所在城市','融资方所在城市']).sum() #分组计算
tc_sum = tc_sum.sort_values('投资企业对数',ascending = False) #按投资企业对数降序排序
del tc_sum['年份'] #删除年份字段
tc_top = tc_sum.iloc[:20] #筛选出同城TOP 20 数据
print(tc_top)
kc_data = data[data['投资方所在城市']!=data['融资方所在城市']] #筛选跨城投资数据
kc_sum= kc_data.groupby(['投资方所在城市','融资方所在城市']).sum() #分组计算
kc_sum = kc_sum.sort_values('投资企业对数',ascending = False) #按投资企业对数降序排序
del kc_sum['年份'] #删除年份字段
kc_top = kc_sum.iloc[:20] #筛选出同城TOP 20数据
print(kc_top)
#绘制TOP20数据柱状图
tc_top.plot(kind='bar',grid = True,color= 'tomato',alpha = 0.8,figsize = (12,