1.目标
爬虫豆瓣电影top250(https://movie.douban.com/top250?start=0)
2. 代码实现
难点1:多页爬虫编辑url
观察到页面切换仅是start参数变化,第一页:start=0,第二页:start = 25。因此可以这样写url:
for i in range(10):
url = 'https://movie.douban.com/top250?start={}'.format(i*25)
爬虫豆瓣电影top250(https://movie.douban.com/top250?start=0)
观察到页面切换仅是start参数变化,第一页:start=0,第二页:start = 25。因此可以这样写url:
for i in range(10):
url = 'https://movie.douban.com/top250?start={}'.format(i*25)