一、明确需求
爬取豆瓣排行电影信息
二、发送请求
请求url地址,使用get请求,添加headers请求头,模拟浏览器请求
三、获取数据
requests.get(url=url, headers=headers) 请求网页返回的是response对象
response.text: 获取网页文本数据
response.json: 获取网页json数据
四、解析数据
常用解析数据方法: 正则表达式、css选择器、xpath、lxml…
五、保存数据(数据持久化)
常用的保存数据方法 with open
像豆瓣电影信息这样的数据,保存到Excel表格里面会更好。
所以需要使用到 csv 模块