根据2020年nature上发表的论文《Mobility network models of COVID-19
explain inequities and inform reopening》其中的内容,借鉴其构建二部图的思路。
需要两个字典dist_placekey和dist_cbg,将placekey作为V_poi的唯一标识,将cbg作为V_cbg的唯一标识,cbg->poi的人数作为边的权重。数据处理的关键在于visitor_daytime_cbgs。
可能需要两种边,第一种visitor_home_cbgs,第二种visitor_daytime_cbgs。这里先使用visitor_daytime_cbgs进行建图。
- 代码
使用pandas选取需要的数据并用边集数组
使用边集数组+边权重的方式保存图数据
import pandas as pd
import json
file_loc='D:/baidu_netdisk/safegraph/weeklyPlacesPatterns/patterns_backfill/2020/12/14/21/2020/06/08/2020-06-08-weekly-patterns-NY.csv'
df=pd.read_csv(file_loc)
df=df[['placekey','visitor_daytime_cbgs']]
n=df.shape[0]
map_placekey=dict()
i_dict_placekey=0
map_cbg=dict()
i_dict_cbg=0
i_cbg=0
edge_num=0
file_res=