练习---将爬取的豆瓣TOP250存储到Excel表中

最新推荐文章于 2022-07-21 20:10:14 发布

Croyance_M

最新推荐文章于 2022-07-21 20:10:14 发布

阅读量1.6k

点赞数

分类专栏：爬虫学习

本文链接：https://blog.csdn.net/Croyance_M/article/details/89641487

版权

该博客介绍了如何爬取豆瓣网站的TOP250电影和书籍信息，并将其存储到Excel表格中。在处理书籍数据时，由于部分书籍缺少简介，博主特别增加了异常处理机制，当简介为空时会提示‘暂无简介’。

摘要由CSDN通过智能技术生成

爬取豆瓣TOP250的电影，存在Excel中

import requests
from bs4 import BeautifulSoup
import xlwt

#------将爬取内容-豆瓣电影250-存储到excel表格中----------

def excel(movies,save_file):
#存储成excel表
	wb=xlwt.Workbook()  #创建工作表
	sheet=wb.add_sheet('test')  #创建表名
	for m in range(len(movies)): #遍历有几个movie
			#m=0,第一个movie
		for i in range(len(movies[m])):
			sheet.write(m,i,movies[m][i])
	wb.save('C:/Users/Xpeng/Desktop/爬取到的表格/'+save_file+'.xls')

movies=[]  #建个总的movies列表，方便后来Excel的存储

def movie_name(url):
	#获取某页的电影名
	res=requests.get(url)
	html=res.text
	soup=BeautifulSoup(html,'html.parser')
	items=soup.find(class_="grid-16-8 clearfix").find(class_="grid_view").find_all('li')

	for i in items:	 #遍历每一页每一个电影
		movie=[]   #每一页每一个电影都存成一个movie列表
		title=i.find(class_="hd").find(class_="title")
		star=i