主要使用到了python解析html的库BeautySoup,貌似bs并不支持解析所有的节点,而且目标网页在body中嵌套了多层的div,bs不支持层层解析。本文采用了bs的find_all方法,查到所有的目标节点,然后进行过滤。先得到文件名字,然后获取目标文件的url,最终拼在一起保存至本地。代码如下:
import requests
import os
from bs4 import BeautifulSoup
url = "http://www.tuke88.com/yinxiao/p1009/?se=1&pl=139-2691&ky=378722&bd_vid=10149183154771887629" # 歌曲列表的url
targetDir = "D:\\music"
# 获取网页信息
html = requests.get(url)
soup = BeautifulSoup(html.text, features=