翻页分析
在豆瓣电影中搜索“王祖贤”,进入王祖贤主页后,点击全部影人图片,进入到影人图片页面。
在该页面点击下一页,可以看到浏览器的 URL 变化如下:
https://movie.douban.com/celebrity/1166896/photos/?type=C&start=30&sortby=like&size=a&subtype=a
继续使用 Postman 来分析 URL,可以很轻松的得知,start 就是类似于 page 的页数控制参数,而且步长为 30,即第一页是 start = 0,第二页为 start = 30,第三页为 start = 60,以此类推。
详情页分析
使用 Network 来查看页面上的图片信息:
这里我们得到了两个信息:
- a 标签中的链接可以得到每张图片的评论信息;
- img 标签中的链接可以用来保存女神的海报。
对于这两个信息 url,可以分别返回:
在学习过程中有什么不懂得可以加我的
python学习交流扣扣qun,784758214
群里有不错的学习视频教程、开发工具与电子书籍。
与你分享python企业当下人才需求及怎么从零基础学习好python,和学习什么内容
def get_posters():
comment_url_list