在初学爬虫(二):爬取静态网页之(2)获取网页响应内容——requests.get()函数中讲解了如何使用requests函数获取网页响应内容。
但是,有些网页不能如上直接被获取,而是需要对requests中的参数进行设置才能获取需要的数据。
1、设置传递URL(网络地址)参数
如果需要请求获取特定的数据,就需要在URL(网络地址)的查询字符串中加入一些数据来实现。
在requests中,直接使用params参数就可以实现设置URL参数:
import requests
key_dict = {
'k1': 'v1', 'k2': 'v2'} #创建一个字典
r = requests.get('http://httpbin.org/get', params=key_dict