今天爬取的是去哪儿网上的上海旅游景点,我们要爬取的是景点的经纬度、景点名称、点评数、星级、攻略提到的次数
爬取出来的数据如下(我只截取了前10条数据):
爬取的网址是:https://travel.qunar.com/p-cs299878-shanghai-jingdian
首先是导入工具库
用途:用requests对网址发出请求后,用BeautifulSoup解析网址
这里拓展一下:200 说明服务器已成功处理请求
302 说明服务器目前从不同位置的网页响应请求,类似跳转页面
404 说明服务器找不到请求的页面