python爬虫基础(一次性爬多首音乐)
嗨!收到一张超级美丽的风景图,愿你每天都能顺心!
发送请求
#寻址
url = 'https://music.163.com/playlist?id=110759778'
#伪装
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'
}
#发送请求
res = requests.get(url,headers=headers)
#保存地址文本内容
html_data = res.text
解析数据
这里用到我们的内置模块正则表达式 import re(当然也可以用外置模块beautifulsoup解析数据)
很明显只有id和名字不一样
那么我们只需要获取到id和名字可以了
正则表达式只需要把我们想要获取的内容改成 .*?即可
music_info = re.findall('<li><a href="/song\?