python爬虫
哈哈哈浩瀚海洋
第三方对对对对方
展开
-
酷狗top500的爬虫
import requests from bs4 import BeautifulSoup import time #导入相应的库文件 headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36' '(KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'#加入请求头 } def get...原创 2020-12-16 21:22:46 · 189 阅读 · 0 评论 -
3.32 小猪短租的爬虫-
够造主网页的url获取函数,从主网页中获取到详情页的链接,从详情页中获取到标题,价格,评论等内容 这里因为ip反爬,返回的是错误的网页,所以后续失败 #这里进行了反爬,返回的网页进行了重定向,不是自己要爬的网址 from bs4 import BeautifulSoup import requests import time #导入相应的库文件 url ="https://bj.xiaozhu.com/fangzi/1047842478.html" headers = { ..原创 2020-12-16 04:50:50 · 625 阅读 · 2 评论