目的?
这是一个python练习,通过这个练习,我们可以了解:
- 使用python发起http请求
- python的文件操作
- python的数据库操作
一、分析列表页面
- 首先分析一下某网站的专辑页面要素,想办法获取页面红色列表信息数据。理论上,每个音频大致包括:id、标题、音频地址、更新时间等等
- 在浏览器调试工具中,查看一下http请求。大致找一下,看看能不能找到相应的数据。看看是直接页面生成的,还是有额外的api获取数据
在network分析中,快速浏览一下所有的http请求,查看响应的结果,很快就能找到
在请求中,我们发现了一个请求/revision/album/v1/getTracksList?albumId=18521227&pageNum=1,对就它了
结合页面的情况,还有响应的结果,我们应该能猜到:albumId应该就是专辑ID,而pageNum应该就是页面了,我们验证一下
没有错,这个就是列表信息的请求url了。json响应结果中,我们找比较重要的信息:trackId-音频ID,title-音频标题,url-音频播放地址