Get方法抓取百度首页
- 发送请求来取得服务器上的资源
- 基于URL,所有参数都附在URL中
- 请求:GET /index.html HTTP/1.1 Host: www.hackr.jsp
- 响应:返回index.html的页面资源
实现思路:
1:安装requests库
2:确定URL
3:使用requests的get请求方法
response = requests.get(‘https://www.baidu.com’)
4:查看响应的内容
response.content
response.text
response.headers
response.status_code
实现代码:
import requests
#1.网页的请求抓取
response = requests.get('https://wwww.baidu.com')
response.encoding='utf-8'
#2.查看响应的全部内容
print(type(response.text))
print(response.text)
#3.查看响应的具体属性
print(response.headers)
print(response.status_code)
print(response.cookies)