百度迁徙数据是一种较为常用的互联网数据,在之前的文章里小编已经讲了百度迁徙数据是什么、怎么获取、该如何处理、怎么用它做和弦图这些内容。但是其中数据的获取部分一直没有详细讲解,那么该如何获取它呢?
今天,就告诉大家一个可以公开获取该数据的途径吧,可以直接下载的哦!
数据网址
https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/FAEZIO
数据时间
1.百度迁徙数据
2020年01月01日-2020年05月03日
2020年09月22日-2021年03月27日
2.百度迁徙规模指数
2020年01月01日-2020年05月03日
3.百度城内出行强度
2020年01月01日-2020年05月02日
数据格式
csv格式,部分含有tab格式文件
数据下载
打开上述网址,我们可以先勾选当前界面的文件,再点击弹出的"Select all 615 files in this dataset",即可选中所有文件,点击右侧Download里的原始格式即可下载全部为csv格式的文件,如下图。
数据预览
以2020年01月01日的迁入数据预览一下:
注意事项
该数据按天存储,与前文【数据处理】怎么将百度迁徙数据处理成可以使用的格式?里介绍的数据格式不同,不需要进行前期的数据处理,只需要简单地做一下逆透视表的操作就可以了。