import urllib.request
import json
import re
import os
def Header(url):
#创建请求头部
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400"}
req = urllib.request.Request(url, headers=headers)
#打开url
reponse = urllib.request.urlopen(req)
lycJson = reponse.read().decode("utf-8","ignore")
return lycJson
def lyricsCrawer(music_id):
url = 'http://music.163.com/api/song/lyric?' + 'id=' + str(music_id) + '&lv=1&kv=1&tv=-1' # 括号中填入歌曲id
lyc=Header(url)
#进行json的解码
l=json.loads(lyc)
#l是字典类型的 l字典里面读取键lyc得到一个value 而value又是一个字典类型的 再读取键lyric得到时间戳和歌词
data=l["lrc"]["lyric"]
#利用正则表达式去掉歌词前面的时间戳
re_lyrics=re.compile(r"\[.*\]"
网易云音乐歌词爬取并保存在本地
最新推荐文章于 2024-03-19 10:47:17 发布