豆瓣电影TOP 250--数据采集

在这里插入图片描述
代码区域:

import requests
from lxml import etree


class DouBan:
    urls = ['https://movie.douban.com/top250?start={}'.format(str(count)) for count in range(0, 251, 25)]

    def get_movie_data(self):
        for url in self.urls:
            html = requests.get(url).text
            html_dom = etree.HTML(html)
            movie_list = html_dom.xpath('.//ol[@class="grid_view"]/li')
            for movie in movie_list:
                title = movie.xpath('.//span[@class="title"]/text()')[0]
                msgs = movie.xpath('.//div[@class="bd"]/p[@class=""]/text()')
                director_and_protagonist = msgs[0].strip().split('   ')
                director = director_and_protagonist[0].replace('导演: ', '')
                protagonist = director_and_protagonist[1].replace('主演: ', '') if len(
                    director_and_protagonist) == 2 else ''
                mark = msgs[1].strip().replace(' ', '')
                star = movie.xpath('.//span[@class="rating_num"]/text()')[0]
                quote = movie.xpath('.//span[@class="inq"]/text()')[0]
                print(url, title, director, protagonist, mark, star, quote)


db = DouBan()
db.get_movie_data()

效果展示:
在这里插入图片描述
以后有需要的时候可以对接到前端展示,周末有时间的时候就可以照着列表找找高质量电影观看了。薯片+快乐水,enjoying!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值