safegraph数据预处理(五):pandas选取需要的数据并用边集数组+边权重的方式保存图数据

本文介绍了如何根据Nature论文《Mobility network models of COVID-19 explain inequities and inform reopening》的方法,利用pandas从safegraph数据中选择所需信息,构建二部图。重点在于创建两个字典dist_placekey和dist_cbg,并以边集数组和边权重形式存储图数据。目前重点关注visitor_daytime_cbgs,以cbg到poi的访问人数为边的权重。后续计划结合纽约时报的疫情数据进行更深入分析。
摘要由CSDN通过智能技术生成

根据2020年nature上发表的论文《Mobility network models of COVID-19
explain inequities and inform reopening》其中的内容,借鉴其构建二部图的思路。

需要两个字典dist_placekey和dist_cbg,将placekey作为V_poi的唯一标识,将cbg作为V_cbg的唯一标识,cbg->poi的人数作为边的权重。数据处理的关键在于visitor_daytime_cbgs。
可能需要两种边,第一种visitor_home_cbgs,第二种visitor_daytime_cbgs。这里先使用visitor_daytime_cbgs进行建图。

  • 代码
    使用pandas选取需要的数据并用边集数组
    使用边集数组+边权重的方式保存图数据
import pandas as pd
import json

file_loc='D:/baidu_netdisk/safegraph/weeklyPlacesPatterns/patterns_backfill/2020/12/14/21/2020/06/08/2020-06-08-weekly-patterns-NY.csv'
df=pd.read_csv(file_loc)
df=df[['placekey','visitor_daytime_cbgs']]
n=df.shape[0]
map_placekey=dict()
i_dict_placekey=0
map_cbg=dict()
i_dict_cbg=0
i_cbg=0
edge_num=0
file_res=
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值