一、准备工作
安装 requests 库和 beautifulsoup4 库:
requests 库是处理HTTP请求的一个简洁且简单的第三方库;beautifulsoup4 库是一个解析和处理HTML 和 XML 的第三方库。
二、对网站HTML源码进行分析
通过对 HTML 源码进行分析,“ 歌手-歌名 ” 信息被封存在标签中,标签在 “class=pc_temp_songlist” 的 标签中。因此,可以用在beautifulsoup4 中的 select 方法来进行筛选:
同样对歌曲时长的分析方法也是跟上面一样,对 select 的具体用法可以参考如下:
Python中在BeautifulSoup库里的find_all、select用法
推荐 :020 持续更新,精品小圈子每日都有新内容,干货浓度极高。
结实人脉、讨论技术 你想要的这里都有!
抢先入群,跑赢同龄人!(入群无需任何费用)
点击此处