豆瓣电影分类排行榜 - 剧情片爬虫
Tips:
- 爬取的页面:https://movie.douban.com/typerank?type_name=%E5%89%A7%E6%83%85&type=11&interval_id=100:90&action=
- 发起get请求,通过对返回的json数据进行解析,选择自己所需的数据保存即可
- 而具体如何寻找构造请求的url以及相应参数,就不细讲了(写起来太麻烦了,大家读起来也累 doge)
import requests,json
class DouBan:
def __init__(self):
self.url = "https://movie.douban.com/j/chart/top_list?"
self.ua = {
"user-agent": "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24"}
def get_info(self,param):
resp = requests.get(url=self.url,
params = param,
headers=self