- 博客(1)
- 收藏
- 关注
原创 爬取电影网站笔记
import requestsfrom bs4 import BeautifulSoupimport pandas as pd(该段为导入包)page_indexs = range(0, 250, 25)(构造分页数字列表,爬取的网页共有10页,每页的差别是25,所以生成10个从0开始,间隔25的数,以方便后面引用)def download_all_htmls(): """ 下载所有列表页面的HTML,用于后续的分析 """ htmls = []...
2021-10-20 22:26:29
154
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人