引言
百度慧眼迁徙3.0上线,在选择某一城市的“迁出目的地”或“迁入来源地”后,即可查看该城市迁出、迁入人口的迁徙来源与迁徙时间趋势。对城市大数据研究有所帮助。本文采取Python爬虫抓取百度慧眼数据。
image
准备工作
工具:Chrome
2.查找数据源。
使用开发者工具(F12),打开Network,搜索关键字json。
image
右侧preview预览,打开data内的list,即可看到json格式的数据。
image
3.数据解析
查找json信息后,发现cityrank.jsonp、provincerank.jsonp和historycurve.jsonp都是可以利用的数据。cityrank是精确到市级的数据来源,provincerank是精确到省级的数据来源,historcurve是表示该地历史数据。本文对cityrank.jsonp、provincerank.jsonp进行了爬取。
4.Url解析
右键,open in tab查看地址栏地址。 example:http://huiyan.baidu.com/migration/cityrank.jsonp?dt=province&id=330000&type=move_in&callback=jsonp_1581412681419_9173670
这里可以看到参数有dt,id,type&#x