python下载百度音乐

之前看到有人写过类似的代码,感觉有点累赘,其中登陆那些东西其实可以避免的

我把百度音乐的网页代码稍微分析了一下,如果要求不高,下载普通音质的歌曲是不需要登陆的(当然如果你用浏览器打开下载的话,普通音质也是要求登陆下载的)

看其代码发现,即使你没有登陆,其实下载链接也已经暴露出来了,只是用javascript阻止了你在浏览器中下载,

我下面写了一个下载的demo,顺便测试了一下多进程,批量下载很实用:

#!/usr/bin/env python
#-*- coding: UTF-8 -*-

import sys,os
import urllib,urllib2
from bs4 import BeautifulSoup
import json
from multiprocessing import Process

class BaiDuMusic():
    def __init__(self):
        reload(sys)  
        sys.setdefaultencoding('utf8')   

    def search(self,songName):
        firstUrl = "http://music.baidu.com/search?key="+urllib.quote(str(songName))
        userAgent = " User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36 "
        headers = { 'User-Agent' : userAgent }
        requst = urllib2.Request(firstUrl,headers = headers) 
        result = urllib2.urlopen(requst).read()

        #使用BeautifulSoup快速解析html文档
        soup = BeautifulSoup(result,from_encoding="utf-8")
        res_arr = []
        try:
            tmpjson = soup.find_all("li", { "class" : "bb-dotimg clearfix song-item-hook " })
            for x in tmpjson:
                tmpobj = json.loads(x['data-songitem'])
                value = unicode(tmpobj['songItem']['oid'])+"+++"+unicode(tmpobj['songItem']['author'])+"+++"+unicode(tmpobj['songItem']['sname'])[4:-5]
                res_arr.append(value)
            return res_arr
        except Exception, e:
            print u"抱歉没有找到相关资源".encode("utf-8")
            return 0
    def download(self,songid,songName,savePath="down/"):
        songNewUrl = "http://music.baidu.com/data/music/file?link=&song_id="+str(songid)
        if not os.path.isdir(savePath):	
        	os.makedirs(savePath)
        savemp3 = savePath.decode('utf-8')+songName.decode('utf-8')+u".mp3"
        urllib.urlretrieve(songNewUrl, savemp3) 
 
if __name__=='__main__':

    bMusic = BaiDuMusic()
    res = bMusic.search(u"冰雨")
    # for x in res: 
        # print x
    # 1128053+++刘德华+++冰雨
    # 7327899+++李翊君+++冰雨
    # 53535187+++张恒+++冰雨
    Process(target=bMusic.download, args=(1128053,"刘德华-冰雨")).start()
    Process(target=bMusic.download, args=(7327899,"李翊君-冰雨")).start()
    Process(target=bMusic.download, args=(53535187,"张恒-冰雨")).start()


多次测试发现还有一些小问题,比如你搜的歌曲不完整,歌曲:”我可以抱你吗“,你搜的是“我可以抱你” 那么结果会把“我可以抱你”加上em标签

上面代码是没有去掉的,需要用正则处理一下

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值