PYTHON解析BAIDU的MP3列表

最新推荐文章于 2022-10-07 16:22:47 发布

Liu_Fengming

最新推荐文章于 2022-10-07 16:22:47 发布

阅读量1.1k

点赞数

分类专栏： Python/R/Batch

本文链接：https://blog.csdn.net/iluckyflower/article/details/15809757

版权

Python/R/Batch 专栏收录该内容

5 篇文章 1 订阅

订阅专栏

1 运行wget -i Baidump3URL.txt
2 运行BaiduMp3.py> baidump3.txt
3 运行del *.htm?
获得baidu所有歌曲的名字列表

Baidump3URL.txt：

http://list.mp3.baidu.com/song/A.htm
http://list.mp3.baidu.com/song/B.htm
http://list.mp3.baidu.com/song/C.htm
http://list.mp3.baidu.com/song/D.htm
http://list.mp3.baidu.com/song/E.htm
http://list.mp3.baidu.com/song/F.htm
http://list.mp3.baidu.com/song/G.htm
http://list.mp3.baidu.com/song/H.htm
http://list.mp3.baidu.com/song/J.htm
http://list.mp3.baidu.com/song/K.htm
http://list.mp3.baidu.com/song/L.htm
http://list.mp3.baidu.com/song/M.htm
http://list.mp3.baidu.com/song/N.htm
http://list.mp3.baidu.com/song/O.htm
http://list.mp3.baidu.com/song/P.htm
http://list.mp3.baidu.com/song/Q.htm
http://list.mp3.baidu.com/song/R.htm
http://list.mp3.baidu.com/song/S.htm
http://list.mp3.baidu.com/song/T.htm
http://list.mp3.baidu.com/song/W.htm
http://list.mp3.baidu.com/song/X.htm
http://list.mp3.baidu.com/song/Y.htm
http://list.mp3.baidu.com/song/Z.htm

BaiduMp3.py：

#!/usr/bin/python

import urllib
import string
import re

def GetContent (url):
  try:
    URLFile=urllib.urlopen(url)
  except IOError:
    print "\nCan not retrieve ",url,"!\nThe connection cannot be made!\n"
  else:
    HTMLText=URLFile.read()
    URLFile.close()
    return HTMLText


if(__name__=="__main__"):
  file=open('Baidump3URL.txt','r')
  fileread=file.read()
  urls=fileread.split('\n')
  
  queue=[]
  #
  regexp=re.compile(r'" target=_blank>(.*?)</[aA]></td>')
  for url in urls:
    #print url
    url=re.sub('http://list.mp3.baidu.com/song','.',url)
    #print url
    
    content=open(url,'r').read()
    lines=content.split('\n')
    
    for line in lines:
      #print line
      ccc=regexp.search(line)
      if(ccc):
        word=ccc.groups()[0]
        if word in queue:
          pass
        else:
          queue.append(word)
          
    #print url
  file.close()
  
  regexp1=re.compile(r'[- ](.*)')
  
  for w in queue:
  
    w = unicode(w,'cp936')
    w = w.encode('utf8')
    
    ccc=regexp1.search(w)
    if(ccc):
      w=ccc.groups()[0]
      #print w
        
    w=re.sub('《|》|,|\.|·|!','',w)
    if(''==w):
      continue
    print w

Liu_Fengming

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PYTHON解析BAIDU的MP3列表

1 运行wget -i Baidump3URL.txt2 运行BaiduMp3.py> baidump3.txt3 运行del *.htm?获得baidu所有歌曲的名字列表Baidump3URL.txt：http://list.mp3.baidu.com/song/A.htmhttp://list.mp3.baidu.com/song/B.htmhttp
复制链接

扫一扫

专栏目录