Python豆瓣网Top250

代码

import requests
from bs4 import BeautifulSoup
import csv
start=25
Movie_url = []
Movie_name = []
top=[]
head=["电影名","链接"]
headers={
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36"
                      }
def init(n):
    global Movie_url
    global Movie_name
    Movie_url.clear()
    Movie_name.clear()
    url=f"https://movie.douban.com/top250?start={25*n}&filter="
    page=requests.get(url=url,headers=headers)
    soup=BeautifulSoup(page.text,'lxml')
    moive_url=soup.select(".pic>a")
    moive_name=soup.select(".pic>a>img")
    for i in moive_url:
        Movie_url.append(i['href'])
    for i in moive_name:
        Movie_name.append(i['alt'])
    for i in range(25):
        top.append([Movie_name[i],Movie_url[i]])
if __name__=="__main__":
    # init(0)
    # print(Movie_url)
    # print(Movie_name)
    # # print(Movie_url)
    #csv文件保存
    with open("Top250.csv", 'w', newline='') as f:
        writer=csv.writer(f)
        writer.writerow(head)
        for i in range(10):
            init(i)
        for i in range(25*10):
            writer.writerows([top[i]])
            print(f"爬取{top[i][0]}成功")

效果图

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值