Python爬虫提取数据无非下面四点
1. 要获得怎么样的数据
2. 找到数据来源
3. 模拟浏览器发送请求获得数据
4. 处理数据,保存数据
第一步:要获得怎么样的数据
首先明白要提取什么数据,这里我们提取数据的url地址为:https://m.douban.com/music/newchinese
我们要提取里面的标题,歌手,评分,类型,精彩评论
第二步:找出数据来源
在这里PC版和手机版信息已经对比过,手机版的信息更易提取
我们打开手机版的页面
勾上箭头保证刷新页面后,不会刷新请求包
从而发现信息在该请求中