python简单爬虫案例
import requests
'''
如果程序返回的是(response 418)表示该网站是一个发爬虫网站,存在反爬的机制
解决方法:就是获取到网站的"User-Agent"
'''
url="https://www.douban.com/" #豆瓣首页
head={
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36"
}
r=requests.get(url=url,headers=head)
r.status_code #打印状态码为200表示获取成功
print(r)
print(r.text) #获取HTML代码