爬取豆瓣TOP250的电影,存在Excel中
import requests
from bs4 import BeautifulSoup
import xlwt
#------将爬取内容-豆瓣电影250-存储到excel表格中----------
def excel(movies,save_file):
#存储成excel表
wb=xlwt.Workbook() #创建工作表
sheet=wb.add_sheet('test') #创建表名
for m in range(len(movies)): #遍历有几个movie
#m=0,第一个movie
for i in range(len(movies[m])):
sheet.write(m,i,movies[m][i])
wb.save('C:/Users/Xpeng/Desktop/爬取到的表格/'+save_file+'.xls')
movies=[] #建个总的movies列表,方便后来Excel的存储
def movie_name(url):
#获取某页的电影名
res=requests.get(url)
html=res.text
soup=BeautifulSoup(html,'html.parser')
items=soup.find(class_="grid-16-8 clearfix").find(class_="grid_view").find_all('li')
for i in items: #遍历每一页每一个电影
movie=[] #每一页每一个电影都存成一个movie列表
title=i.find(class_="hd").find(class_="title")
star=i