用python写爬虫----爬取电视剧基本信息

最新推荐文章于 2024-06-20 17:44:19 发布

heyh_py

最新推荐文章于 2024-06-20 17:44:19 发布

阅读量4.6k

点赞数 2

文章标签：爬虫豆瓣

本文链接：https://blog.csdn.net/heyh_py/article/details/80464728

版权

刚刚入门学习爬虫，试着爬取豆瓣的电视剧信息练手。废话不多说，进入正题。

工具：python、互联网、谷歌浏览器

import json
import requests


class TvSpider:
    '''豆瓣电视爬虫'''

    def __init__(self, country):
        '''
        爬虫类的初始化
        :param country: 要爬去的国家，命名需与豆瓣的相契合
        '''
        # 要爬取的电视的国家全称
        self.country = country
        # 要爬去电视列表的第一页 在豆瓣电视剧的列表也找到items开头的请求，
        self.url = 'https://m.douban.com/rexxar/api/v2/subject_collection/filter_tv_{}_hot/items?start=0&count=18'.format(
            country)
        self.headers = {
            "User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1",
            # 关联的url，必须加，否则豆瓣的反扒措施会让你一无所获
            "Referer": "https://m.douban.com/tv/"}

    def write_data(s

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

heyh_py

关注关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
用python写爬虫----爬取电视剧基本信息

刚刚入门学习爬虫，试着爬取豆瓣的电视剧信息练手。废话不多说，进入正题。工具：python、互联网、谷歌浏览器import jsonimport requestsclass TvSpider: '''豆瓣电视爬虫''' def __init__(self, country): ''' 爬虫类的初始化 :para...
复制链接

扫一扫