要求
下载一百首歌曲,相关图片以及相关文字信息
存储方式分别为:
.mp3
.txt
.png
比如第一首歌曲相关信息为001.mp3\001.txt\001.png
觉得像是小朋友的抄写作业有没有……
想试试看爬-虽然我也不知道行不行
思路
一开始的想法是全都直接根据歌单获取歌曲的ID,然后每首歌都按那个格式001.mp3\001.txt\001.png存下来
后来发现我好像做不到直接下mp3……因为在网页版一点会跳出来请在PC版下载(咦所以结果我也不知道怎么操作……)
然后计划就变成了 - 爬图片+歌词,命名成和音乐同个格式,然后按名字排序之后就可以用改名软件批量直接改成这个样子了(自以为很机智)
虽然本人对python的理解还停留在曾经因作业要求爬过一次的莎士比亚全集……
准备
软件
如果你和我一样智障的话你可能需要如下资料
然后不一定都有用……因为我是一直在改别人的代码……
python环境变量配置(我把script也加进去了)
http://www.cnblogs.com/wuzhiyi/p/4763073.html
(环境变量修改后需要重启程序)
安装easy_install
http://www.cnblogs.com/haython/p/3970426.html
安装pip
http://jingyan.baidu.com/article/e73e26c0d94e0524adb6a7ff.html
安装selenium
http://blog.csdn.net/u011151028/article/details/50338347
Phantom
https://www.waitalone.cn/selenium-phantomjs.html
exprcted an indented block - 调整缩进
具体操作
美汤(程序员都是吃货系列
好像是评论比较难爬
然后没有追求的我就把这一块都去了……
http://www.jianshu.com/p/2b783f7914c6
先对着一个歌单把ID爬下来
然后再对着ID爬各种……(只能想到这样了)
http://www.bkjia.com/Pythonjc/1189598.html
歌曲
https://www.zhihu.com/question/41505181
python 下载mp3(这个例子是百度音乐的)
http://www.th7.cn/Program/Python/201507/499020.shtml
图片
http://www.tuicool.com/articles/6NVjAjr
http://www.th7.cn/Program/Python/201603/775611.shtml
http://www.cnblogs.com/Albert-Lee/p/6276847.html
歌词
https://juejin.im/entry/59185f37da2f60005dee09d3
http://www.cnblogs.com/Beyond-Ricky/p/6757954.html
具体实现
应该可以从如下代码中看到以上一些参考文献的痕迹(捂脸)
虽然拼凑痕迹有点明显orz反正能大概实现功能已经很满意了
读取歌单
# 爬取某歌单的所有歌曲ID
def getSongIdList():
songIdList = []
playListUrl = 'http://music.163.com/playlist?id=918802417'#空城 finished
soup = BeautifulSoup(_session.get(playListUrl).content)
ul = soup.find('ul', attrs={
'class': 'f-hide'})