01_douban.py

最新推荐文章于 2023-01-06 14:13:33 发布

wang_ning19881220

最新推荐文章于 2023-01-06 14:13:33 发布

阅读量111

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/qq_22207087/article/details/87871557

版权

Python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

# coding=utf-8
import requests
import json

class Douban:
    def __init__(self):
        self.url_temp = 'https://m.douban.com/rexxar/api/v2/subject_collection/filter_tv_american_hot/items?start={}&count=18&loc_id=108288'
        self.headers = {
            "Referer": "https://m.douban.com/tv/american",
            "User-Agent":"Mozilla/5.0 (Linux; Android 5.0; SM-G900P Build/LRX21T) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Mobile Safari/537.36"
        }

    def parse_url(self,url):
        print(url)
        resp = requests.get(url,headers = self.headers)
        json_str = resp.content.decode()
        return json_str

    def get_content_list(self,json_str):
        temp_dict = json.loads(json_str)
        return temp_dict["subject_collection_items"]
        #return temp_dict.setdefault("subject_collection_items")

    def save_content_list(self,content_list):
        with open("douban.txt","a",encoding="utf-8") as f:
            for content in content_list:
                f.write(json.dumps(content,ensure_ascii=False))
                f.write("\n")
        print("保存成功")

    def run(self): #实现主要逻辑
        num = 0
        while True:
            #1. start_url
            next_url = self.url_temp.format(num)
            #2. 发送请求,获取响应
            json_str = self.parse_url(next_url)
            #3. 提取数据
            content_list = self.get_content_list(json_str)
            #4. 保存
            self.save_content_list(content_list)
            #5. 构造下一页的url地址,循环 2-5 步
            num+=18

            if len(content_list)<18:
                break
if __name__ == '__main__':
    douban = Douban()
    douban.run()

wang_ning19881220

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
01_douban.py

# coding=utf-8import requestsimport jsonclass Douban: def __init__(self): self.url_temp = 'https://m.douban.com/rexxar/api/v2/subject_collection/filter_tv_american_hot/items?start={}&...
复制链接

扫一扫