请求URL的方法(一)
在分析完爬取数据之后,通过params方法构造请求。程序来源:崔庆才
from pyquery import PyQuery as pq
import requests
def getPage(page):
url = 'https://m.weibo.cn/api/container/getIndex?' #在怎么来?分析Ajax请求
hd = {"User-Agent": 'Mozilla'} # 模仿浏览器
params = {'type': 'uid',
'value': '2830678474',
'containerid': '1076032830678474',
'page': page} # 作为参数增加到url中去
try:
r = requests.get(url, headers=hd, params=params)
r.raise_for_status()
return r.json() # 解析为JSON返回
except:
print('-----')
def parsePage(json):
if json:
items = json.get('data').get('cards') # 是一个列表