python下载百度音乐

最新推荐文章于 2024-04-10 22:28:10 发布

FishBear_move_on

最新推荐文章于 2024-04-10 22:28:10 发布

阅读量514

点赞数

QT pyQT 专栏收录该内容

51 篇文章 0 订阅

订阅专栏

之前看到有人写过类似的代码，感觉有点累赘，其中登陆那些东西其实可以避免的

我把百度音乐的网页代码稍微分析了一下，如果要求不高，下载普通音质的歌曲是不需要登陆的（当然如果你用浏览器打开下载的话，普通音质也是要求登陆下载的）

看其代码发现，即使你没有登陆，其实下载链接也已经暴露出来了，只是用javascript阻止了你在浏览器中下载，

我下面写了一个下载的demo，顺便测试了一下多进程，批量下载很实用：

[python]view plaincopyprint? 
   
 #!/usr/bin/env python  
 #-*- coding: UTF-8 -*-  
   
 import sys,os  
 import urllib,urllib2  
 from bs4 import BeautifulSoup  
 import json  
 from multiprocessing import Process  
   
 class BaiDuMusic():  
     def __init__(self):  
         reload(sys)    
         sys.setdefaultencoding('utf8')     
   
     def search(self,songName):  
         firstUrl = "http://music.baidu.com/search?key="+urllib.quote(str(songName))  
         userAgent = " User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36 "  
         headers = { 'User-Agent' : userAgent }  
         requst = urllib2.Request(firstUrl,headers = headers)   
         result = urllib2.urlopen(requst).read()  
   
         #使用BeautifulSoup快速解析html文档  
         soup = BeautifulSoup(result,from_encoding="utf-8")  
         res_arr = []  
         try:  
             tmpjson = soup.find_all("li", { "class" : "bb-dotimg clearfix song-item-hook " })  
             for x in tmpjson:  
                 tmpobj = json.loads(x['data-songitem'])  
                 value = unicode(tmpobj['songItem']['oid'])+"+++"+unicode(tmpobj['songItem']['author'])+"+++"+unicode(tmpobj['songItem']['sname'])[4:-5]  
                 res_arr.append(value)  
             return res_arr  
         except Exception, e:  
             print u"抱歉没有找到相关资源".encode("utf-8")  
             return 0  
     def download(self,songid,songName,savePath="down/"):  
         songNewUrl = "http://music.baidu.com/data/music/file?link=&song_id="+str(songid)  
         if not os.path.isdir(savePath):   
             os.makedirs(savePath)  
         savemp3 = savePath.decode('utf-8')+songName.decode('utf-8')+u".mp3"  
         urllib.urlretrieve(songNewUrl, savemp3)   
    
 if __name__=='__main__':  
   
     bMusic = BaiDuMusic()  
     res = bMusic.search(u"冰雨")  
     # for x in res:   
         # print x  
     # 1128053+++刘德华+++冰雨  
     # 7327899+++李翊君+++冰雨  
     # 53535187+++张恒+++冰雨  
     Process(target=bMusic.download, args=(1128053,"刘德华-冰雨")).start()  
     Process(target=bMusic.download, args=(7327899,"李翊君-冰雨")).start()  
     Process(target=bMusic.download, args=(53535187,"张恒-冰雨")).start()  

多次测试发现还有一些小问题，比如你搜的歌曲不完整，歌曲：”我可以抱你吗“，你搜的是“我可以抱你” 那么结果会把“我可以抱你”加上em标签

上面代码是没有去掉的，需要用正则处理一下

FishBear_move_on

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python下载百度音乐

之前看到有人写过类似的代码，感觉有点累赘，其中登陆那些东西其实可以避免的我把百度音乐的网页代码稍微分析了一下，如果要求不高，下载普通音质的歌曲是不需要登陆的（当然如果你用浏览器打开下载的话，普通音质也是要求登陆下载的）看其代码发现，即使你没有登陆，其实下载链接也已经暴露出来了，只是用javascript阻止了你在浏览器中下载，我下面写了一个下载的demo，顺便测试了一下多进
复制链接

扫一扫