学习目标:
利用requests库爬取豆瓣电影排行
学习产出:
import requests
import json
if __name__=='__main__':
url='https://movie.douban.com/j/chart/top_list'
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
param={
'type': '11',
'interval_id': '100:90',
'action':'',
'start': '0',
'limit': '20',
}
response=requests.get(url=url,params=param,headers=headers)
list_data=response.json()
fp=open('./电影排行.json','w',encoding='utf-8')
json.dump(list_data,fp=fp,ensure_ascii=False)
fp.close()
print('over')
最终的结果是将数据以json的形式输出的
param中所包含的都是url的参数,在开发者工具中都能找到