爬取imdb资料库

本文介绍如何使用Python编写一个简单的爬虫程序,从IMDb数据库中爬取电影信息,并将这些信息整理存储到Excel表格中。由于IMDb网站允许爬虫直接抓取数据,这个过程无需应对反扒策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

写一个简单的python爬虫程序,爬取imdb资料库,将爬取到的电影信息,存储到一个excel表格中

因为imdb资料库电影网没有反扒措施,直接爬取即可

代码如下:

import requests
from lxml import etree
import pandas as pd
import numpy as np

# 第一页:'http://www.imdb.cn/IMDB250/'
# 第一页:'http://www.imdb.cn/imdb250/2'
# 第三页:'http://www.imdb.cn/imdb250/3'

class IMDB:

    def __init__(self,move_name_list,move_score_list,move_bieming_list,move_ywm_list,move_dir_list,move_time_list):
        self.move_name_list = move_name_list
        self.move_score_list = move_score_list
        self.move_bieming_list = move_bieming_list
        self.move_ywm_list = move_ywm_list
        self.move_dir_list = move_dir_list
        self.move_time_list = move_time_list
        self.spider()

    def shuzu(self,content):
        '''
        将列表转化为二维数组
        :param content: 列表
        :return:  二维数组
        '''
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值