前 言
这一篇爬虫日记是基于B站It学塾的Python爬虫编程基础5天速成(2021全新合集)Python入门+数据分析的爬虫笔记。
有什么不足的欢迎大家进行讨论。
"""
思路:
1.获取页面源码
2.解析
2.1查找规律:
2.2处理数据
3.保存
"""
import re
import time
import requests
from bs4 import BeautifulSoup
import xlwt
def main():
baseurl = "https://movie.douban.com/top250?start="
datalist = get_url(baseurl)
movie_savepath= "MovieTop250.xls" # 数据存储的地方和名字
saveMovieData(datalist,movie_savepath)
# 利用正则表达式匹配我们所需要的内容
find