由于豆瓣里的电影都有专属的id,获取到id后可以进一步爬取其他页面的内容。
首先来到主界面(https://movie.douban.com)观察网页:
点击“选电影”进入需要爬取的界面:
打开Chrome开发模式,并下拉网页观察新生成的文件
可以观察到页面没有跳转,说明该网页采用了异步加载技术,同时生成的主文件为以search_subjects开头的文件
文件页面的url:
通过点击Response选项观察到页面中内容的数据格式为json格式:
因此直接访问主内容所在网页(
python爬取豆瓣电影json数据
最新推荐文章于 2025-04-06 18:17:06 发布