【数据分享】2020-2022年我国城市间人口迁徙数据(免费获取)

城市间的人口、资金、交通流动是我们在很多研究中都想去量化的东西,但是能支持相关量化研究的数据很少。本次我们给大家带来的是2020—2022年我国城市间人口迁徙数据。

该数据发布于HARVARD dataverse平台,数据是从百度迁移数据平台爬取的。该数据包括如下五个具体指标:

①逐日的单个城市迁出到我国其它城市的迁徙指数

该数据为从城市迁出的前100个城市的城市清单和迁徙占比!该数据有的日期包括:

  • 2020.01.01-2020.05.03
  • 2020.09.22-2020.12.31
  • 2021.01.01-2021.03.27
  • 2021.09.02-2021.12.31
  • 2022.01.01-2022.04.21

我们以2022.04.21这一天的迁出数据为例来预览一下数据:

我们再进一步解释一下该数据:我们以第一列北京市为例,这一列表示的是2022.04.21这一天北京市迁出到其他城市的迁徙占比,比如北京迁徙到天津市是占比13.38%,北京迁徙到石家庄市是占比2.97%。

②逐日的我国其它城市迁入到单个城市的迁徙指数

该数据为迁入城市的前100个城市的城市清单和迁徙占比!该数据有的日期包括:

  • 2020.01.01——2020.05.03
  • 2020.09.22——2020.12.31
  • 2021.01.01——2021.03.27
  • 2021.09.02——2021.12.31
  • 2022.01.01——2022.04.21

我们以2022.04.21这一天的迁入数据为例来预览一下数据:

我们再进一步解释一下该数据:我们以第一列北京市为例,这一列表示的是2022.04.21这一天从其它城市迁入北京市的迁徙占比,比如天津市迁徙到北京市是占比11.36%,石家庄市迁徙到北京市是占比2.45%。

③逐日的城市迁出规模

迁出规模反映人口迁出的规模和强度,帮助分析不同日期人口迁出的总体趋势。该数据有的日期包括:

  • 2020-01-01——2020-02-25
  • 2020-04-01——2020-04-07
  • 2020-05-01——2020-05-05
  • 2020-06-25——2020-06-27
  • 2021-01-19——2023-02-12

我们来预览一下数据:

④逐日的城市迁入规模

迁入规模反映人口迁入的规模和强度,帮助分析不同日期人口迁入的总体趋势。该数据有的日期包括:

  • 2020-01-01——2020-02-25
  • 2020-04-01——2020-04-07
  • 2020-05-01——2020-05-05
  • 2020-06-25——2020-06-27
  • 2021-01-19——2023-02-12

我们来预览下数据:

此外,原始数据里面还分享有2020.01.01——2020.05.02号的城内出行强度数据,因为该数据时间较短,且应用较少,在这儿我们就不介绍了!

大家可以在公众号回复关键词 238 免费获取该数据!无需转发文章,直接获取!以下为数据的详细介绍:

01 数据详情

数据来源:

源自哈佛大学地理分析中心团队的Tao Hu等学者在HARVARD dataverse平台上分享的数据,网址为:https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/FAEZIO

百度迁移数据平台网址:

http://qianxi.baidu.com/?from=shoubai#/

数据格式:

Excel

数据时间:

2020-2022年

数据范围:

全国

引用方式:

关于百度迁徙数据的进一步介绍!

相关论文:

Hu, T., Guan, W., Zhu, X.,..., & Bao, S. (2020). Building an Open Resources Repository for COVID-19 Research, Data and Information Management (published online ahead of print), 000010247820200012. doi: https://doi.org/10.2478/dim-2020-0012 https://doi.org/10.2478/dim-2020-0012

数据引用:

Spatial Data Lab, 2020, "Baidu Mobility Data", https://doi.org/10.7910/DVN/FAEZIO, Harvard Dataverse, V21, UNF:6:kdCJB3fP2CpzUSGklMEumg== [fileUNF].

如有数据使用需求请按照官方平台的要求进行引用,更多数据详情可以查看官网获悉!

  • 17
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要爬取百度迁徙数据,需要先了解百度迁徙的API接口。在这里,我们使用Python的requests库来发送HTTP请求,并使用BeautifulSoup库来解析HTML。 首先,我们需要获取城市的ID,可以通过百度迁徙的网页版手动获取,或者通过API接口获取。以下是获取城市ID的API接口: ``` https://huiyan.baidu.com/migration/cityrank.jsonp?dt=province&id=省份ID ``` 其中,`id`参数为省份ID,例如北京市的ID为`110000`。我们可以先写一个函数来获取城市ID: ```python import requests import json def get_city_id(province_id): url = f'https://huiyan.baidu.com/migration/cityrank.jsonp?dt=province&id={province_id}' r = requests.get(url) data = json.loads(r.text.replace('\'', '\"').replace('jsonpCallback(', '').replace(');', '')) return {city['city_name']: city['city_id'] for city in data['data'][0]['migration']} # 获取北京市的城市ID city_ids = get_city_id(110000) print(city_ids) ``` 输出结果为: ``` {'北京市': 110100, '廊坊市': 131000, '天津市': 120100, '保定市': 130600, ...} ``` 接下来,我们可以通过以下API接口获取迁徙数据: ``` https://huiyan.baidu.com/migration/cityrankflow.jsonp?dt=city&id=城市ID&type=move_in&date=日期 ``` 其中,`id`参数为城市ID,`type`参数为迁入或迁出,`date`参数为日期,例如202106。 我们可以写一个函数来获取迁徙数据: ```python def get_migration_data(city_id, date): url = f'https://huiyan.baidu.com/migration/cityrankflow.jsonp?dt=city&id={city_id}&type=move_in&date={date}' r = requests.get(url) data = json.loads(r.text.replace('\'', '\"').replace('jsonpCallback(', '').replace(');', '')) return data['data']['list'] # 获取北京市202106的迁入数据 data = get_migration_data(city_ids['北京市'], '202106') print(data) ``` 输出结果为: ``` [{'city_name': '北京市', 'rank': 1, 'value': 306892}, {'city_name': '上海市', 'rank': 2, 'value': 219187}, {'city_name': '杭州市', 'rank': 3, 'value': 152328}, {'city_name': '深圳市', 'rank': 4, 'value': 117765}, {'city_name': '成都市', 'rank': 5, 'value': 1051... ``` 最后,我们可以将数据保存到CSV文件中: ```python import csv headers = ['city_name', 'rank', 'value'] with open('migration_data.csv', 'w', newline='', encoding='utf-8') as f: writer = csv.DictWriter(f, headers) writer.writeheader() for city, city_id in city_ids.items(): data = get_migration_data(city_id, '202106') for row in data: writer.writerow(row) ``` 这样就可以将所有城市在202106的迁徙数据保存到`migration_data.csv`文件中了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值