python的requests库爬取和re库提取,os库使用(实现爬取wrecking_Ball音乐)

今天,我接着跟大家分享一波爬取wrecking_Ball。昨天搞得东西有点多,没有发文现在补上。
因为,我的fans想要了解一下requests库怎么爬取音频,我就再发几篇文章作为参考。大家也可以看看,希望能对大家有所帮助。

完整代码如下图:

def spyder3():#wrecking ball
	headers1 = {#设置请求报头
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) 				Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.57'
	}
	headers2 = {
    	'User-Agent':'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:86.0) Gecko/20100101 Firefox/86.0'
	}
	headers3 = {
    	'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:78.0) Gecko/20100101 Firefox/78.0'
	}
	headers_ls = []#设置请求报头列表
	headers_ls.append(headers1)
	headers_ls.append(headers2)
	headers_ls.append(headers3)
    url = 'http://www.333ttt.com/up/yy1092490.html'
    headers = random.choice(headers_ls)#从请求头中随机选取,防止被记录行为。(反爬)
    response = requests.get(url,headers=headers)
    html = response.text#获取响应的内容,页面源代码
    print(html)
    href = re.findall('<a href="(.*?)"',html)
    music = ''#定义一个中间变量用于接收音频链接
    music_name = re.findall('<meta property="og:site_name" content="(.*?)" />',html)[0]
    print(music_name)
    for music_href in href:
        if 'mp3' in music_href:
            music += music_href
        else:
            continue
    print(music)
    os.mkdir('F:/music')#在F盘创建一个music文件夹
    Music = requests.get(music,headers=headers)#对链接发出get请求
    with open(r'F:/music/{}.mp3'.format(music_name),'wb+') as f:#以二进制写入音频文件
        f.write(Music.content)
spyder3()#调用函数

运行结果如下图:
在这里插入图片描述
根据正则提取链接:
在这里插入图片描述
根据正则提取音乐名:
在这里插入图片描述
接着去F盘,打开文件夹,下面有我们爬到的音乐。如下图:
在这里插入图片描述
点击播放一下,如下图:
在这里插入图片描述
在这里插入图片描述
可以全部播放,搞定!现在在听Wrecking Ball。过瘾!若是大家在爬取过程遇到问题,可以与我交流探讨。
最后,感谢大家前来观看鄙人的文章,文中或有诸多不妥之处,还望指出和海涵。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不羁_神话

感谢支持,欢迎交流。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值