1.GET方法抓取百度首页
目标:
—熟悉HTTP通信基本过程
—实现requests库的get方法抓取百度首页
—学会查看相应的基本内容
HTTP通信过程:
实现思路:
—安装requests库:(CMD)pip install requests
—确定目标URL
—使用requests.get()方法请求百度首页
—查看响应的全部内容、头部和状态码(https://zhidao.baidu.com/question/1758934322859654828.html)等属性
import requests
def Get_baidu():
#网页请求抓取
response=requests.get('https://www.baidu.com')
response.encoding="utf-8" #显示中文
#查看响应的全部内容
print(type(response.content))
#查看相应的具体属性
print(response.text)
print(response.headers) #查看头部
print(response.status_code) #查看状态代码
print(response.cookies)
Get_baidu()