python 爬虫爬取豆瓣top250保存到excel

import requests
from bs4 import BeautifulSoup
import re
import xlwt
def getContent(row): #从第几条开始
    headers1 = {'User-Agent': 'Mozilla/4.0', 'content-type': 'text/html; charset=utf-8'}
    r = requests.get("https://movie.douban.com/top250?start="+str(row)+"&filter=",headers=headers1)
    html = r.text
    soup = BeautifulSoup(html, "html.parser")
    #print(html)
    return soup
films=[] #用这个做添加
#getContent(0)
def getItem(row):
    soup = getContent(row)
    grid_view=soup.find("ol",attrs={"class":"grid_view"})
    #print(grid_view) #输出所有的ol
    #访问 grid_view 的li
    items = grid_view.find_all("li")        #所有的li
    #print(items[0])                          #输出一个li 肖申克的救赎


    for li in items:
        film = []
        #print(li.find("span",attrs={"class":"title"}).text)     #输出所有标题
        title = li.find("span",attrs={"class":"title"}).getText()
        # print(title)
        # 添加电影标题
        film.append(title)
        rating_num = li.fin
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值