(先谢郭嘉)以链家二手房为例
1.爬取网页所必须的库
import urllib.request
import ssl
2.获取预爬网页信息
(1).网页URL: https://gz.lianjia.com/ershoufang/
(2).根据不同浏览器,获得自己的headres: "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.75 Safari/537.36" 我是用Google浏览器爬的,并没有翻墙
3.下面就可以爬取网页了
以链家二手房为例
1.爬取网页所必须的库
import