题目来源:头歌平台------数据采集与网络爬虫
下述题解均通过测试,如果小伙伴有出现测试不通过的情况,大概是原题出现变化或是编码时出现漏缺,答案仅供参考,祝大家一通百通。
第1关:requests 基础
import requests
def get_html(url):
'''
两个参数
:param url:统一资源定位符,请求网址
:param headers:请求头
:return:html
'''
# ***************** Begin ******************** #
# 补充请求头
header = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/"
"537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/ 537.36"}
# get请求网页
response = requests.get(url,header)
# 获取网页信息文本
response.encoding = "utf-8"
html = response.text
# ***************** End ******************** #
return html
第2关:requests 进阶
import requests
def get_html(url):
'''
两个参数
:param url:统一资源定位符,请求网址
:param headers:请求头
:return html 网页的源码
:return sess 创建的会话
'''
# ***************** Begin ******************** #
# 补充请求头
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/"
"537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/ 537.36"}
# 创建Session, 并使用Session的get请求网页
sess = requests.session()
response = sess.get(url,headers=headers)
# 获取网页信息文本
response.encoding = "utf-8"
html = response.text
# ****************** End ********************* #
return html, sess