豆瓣电影top250

暑假又来了,看电视剧?多浪费时间,何不回味经典呢,对吧,下面和大家一起爬取豆瓣250.相信这应该是和我一样的小白必走过的路吧,没有什么反爬,很适合我这样的小白,所有网站都这样多好(狗头)哈哈。
下面先看爬取的结果吧
在这里插入图片描述
感觉提取发行时间,发行国家,和电影类型的可能不像电影名那样直接。
直接上代码吧

import requests
import parsel
import re
import time
for page in range(10):
    print('**********************正在爬取第{}页************************'.format(str(page+1)))
    base_url='https://movie.douban.com/top250?start={}&filter='.format(str(page))
    headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36'}
    response=requests.get(base_url,headers=headers)
    #print(response)
    response.encoding=response.apparent_encoding
    selector=parsel.Selector(response.text)
    lis=selector.xpath('//ol[@class="grid_view"]/li')
    #print(len(lis))
    for li in lis:
        title=li.xpath('.//span[@class="title"]/text()').get()
        #print(title)
        star=li.xpath('.//div[@class="bd"]/p[1]/text()').get().strip()
        #print(star)
        relaetime=li.xpath('.//div[@class="bd"]/p[1]').re('\d{4}')[0]
        #print(relaetime)
        score=li.xpath('.//span[@class="rating_num"]/text()').get()
        #print(score)
        guojia=li.xpath('.//div[@class="bd"]/p').get()
        guojia=guojia.split('<br>')[1]
        nation=re.findall(' \d{4}.*?/.*?(.*?)/.*?(.*?)</p>',guojia,re.S)[0][0]
        type=re.findall(' \d{4}.*?/.*?(.*?)/.*?(.*?)</p>',guojia,re.S)[0][1].strip()
        #print(nation,type)

        with open('电影.csv',mode='a',encoding='utf-8')as f:
            f.write(f'{title},{relaetime},{score},{nation},{type},{star}')
            f.write('\n')
    print('¥¥¥¥¥¥¥¥¥¥¥¥¥¥第{}页爬取成功¥¥¥¥¥¥¥¥¥¥¥¥¥¥'.format(str(page+1)))
    time.sleep(3)

嘿嘿,祝大家有个愉快的暑假。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
豆瓣电影Top250是豆瓣网站根据用户评分和评价数量统计出的一份电影排行榜单,其中包含了豆瓣用户认可度较高的电影作品。以下是对豆瓣电影Top250的介绍: 1. 《肖申克的救赎》:这部由弗兰克·德拉邦特执导的电影是豆瓣电影Top250中排名第一的作品,它讲述了一个关于友谊、希望和自由的故事。 2. 《霸王别姬》:由陈凯歌执导的这部经典作品是中国电影的代表之一,它以京剧为背景,讲述了两位戏曲演员之间的纠葛与情感。 3. 《这个杀手不太冷》:这部由吕克·贝松执导的法国电影以其紧凑的剧情和精彩的动作场面而闻名,主要讲述了一位职业杀手与一个小女孩之间的故事。 4. 《阿甘正传》:这部由罗伯特·泽米吉斯执导的电影以其温暖感人的故事和托尼·汤普森的精彩表演而广受好评。 5. 《美丽人生》:这部由罗伯托·贝尼尼执导的意大利电影讲述了一个关于爱与希望的故事,它以其独特的方式展现了二战时期的人性与善良。 6. 《千与千寻》:这部由宫崎骏执导的日本动画电影是豆瓣电影Top250中唯一一部动画片,它讲述了一个关于成长和勇气的奇幻故事。 7. 《泰坦尼克号》:这部由詹姆斯·卡梅隆执导的电影以其浪漫的爱情故事和逼真的特效而成为经典之作。 8. 《辛德勒的名单》:这部由史蒂文·斯皮尔伯格执导的电影根据真实事件改编,讲述了一位德国商人在二战期间拯救犹太人的故事。 9. 《盗梦空间》:这部由克里斯托弗·诺兰执导的科幻电影以其复杂的剧情和令人惊叹的视觉效果而备受赞誉。 10. 《忠犬八公的故事》:这部由拉斯·霍尔斯道姆执导的电影根据真实事件改编,讲述了一只忠诚的狗与主人之间的感人故事。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值