目标地址:http://music.163.com/discover/playlist
目标:爬取,歌单封面图、歌单名、歌单链接、播放量、用户名、用户主页链接。并将数据写入Excel表格
步骤:
1.分析页面源码,所需要的数据所在层级关系
2.获取HTML源码
3.解析HTML源码并筛选所需数据
4.将数据写入表格
代码实现如下:
总结:
1.根据层级关系获取元素的规律还需要摸索,了解爬虫的一些理论知识。
2.数据写入表格的方法还需要优化,是否可以一次性写入一行,使代码更简洁明了。