房天下网站租房信息数据加载为动态js加载,分析页面的请求,找到ajax请求的url:
https://m.fang.com/zf/?purpose=%D7%A1%D5%AC¬GetPurpose=1&city=%B9%E3%D6%DD&renttype=cz&c=zf&a=ajaxGetList&city=gz&r=0.0021985656734149206&page=3
其中参数page为变量可以改变这个参数模拟浏览器刷新界面,发送请求方式为get请求,
在获取数据时遇到了个坑在此记录下,按照正常的request的get请求,在请求头中添加headers信息,初始我只添加了user-agent信息,但是这样并没有得到任何的数据,回到nerwork下的ajax页面找到Request请求头信息
:authority: m.fang.com
:method: GET
:path: /zf/?purpose=%D7%A1%D5%AC¬GetPurpose=1&city=%B9%E3%D6%DD&renttype=cz&c=zf&a=ajaxGetList&city=gz&r=0.0021985656734149206&page=3
:scheme: https
accept: */*
accept-encoding: gzip, deflate, br
accept-language: zh-CN,zh;q=0.9
cookie: JSESSIONID=aaaCdLQQAcDgcdgfXxQZw; global_cookie=5d011072-1567300194704-1588c24a; unique_cookie=U_5d011072-156730