相信大家都有过找片两小时,找到累了不想看的经历吧,给大家个建议:在豆瓣高分电影排行榜上挨部看下去,高效不纠结,还都是好片。
今天讲的实例就是用Python爬取豆瓣Top250的电影信息(包含电影排名、电影名、评分、链接),仅用十行代码即可实现,内容简单易上手,小白看完也能学会。
整个流程分为爬取数据、解析数据两个部分,首先先看一下实现环境:
实验环境
- Windows 10
- Python 3.7.3
使用库:
- requests
- pyquery
爬取网页内容
1、确认我们需要爬取的内容(https://movie.douban.com/top250)
</