数字媒体资源管理的第一项作业是,找200首歌,配上一张图和一份txt打包上交。
虽然是可以手动完成的简单任务,但……手动找图建txt实在是太慢了。
本来打算用MusicSorter一键提取歌词和封面,结果不适用于win10(哭哭),也不想安装ffmpeg( @雨诺寒雪 使用的方法)。所以是看看python的库吧(而且python和这个专栏名很搭呢!)
python的mutagen库可以读取mp3中ID3信息
本次作业实际上可以诠释为:
1.分析mp3文件的ID3信息
2.分离ID3信息,输出图片(png)和文本(txt)
3.对歌曲进行重命名
具体过程:
在命令行使用pip install mutagen快速安装
先inport mutagen中需要用到的内容
from mutagen import File
用File函数读取mp3文件,获取tags(就是用查看属性中能看到的标签)信息
audio=File('/Users/Yaminto/Desktop/DAM01/1.mp3')
可以先了解一下mp3中的ID3信息——点击此处查看ID3定义
可以对比我的shell截图食用
u'APIC'是tags中的图片信息,data是图片的数据,将data导出就是图片。
结合歌曲属性面板,可以看到tags中包含的标题作者等信息。
使用audio.tags['XXX']查看不同信息
接下来就是输出部分啦!
因为文本使用unicode编码的,所以要先把编码格式换掉↓
#用来解决UnicodeEncodeError问题
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
print sys.getdefaultencoding()
建立txt文档,逐行写入信息应该不难(w是写,a是追加)
输出图片
mArtwork = audio.tags['APIC:'].data
with open('XXX.png', 'wb') as img:
img.write(mArtwork)
因为有这么多首,当然要用循环一键完成,Windows不太了解,但MAC OS可能会出现奇妙的问题↓
MAC for 循环注意:文件夹中会有一个.DS_Store文件储存文件夹信息,要考虑怎么去除它
*本文并未提供完整代码,所以理解ID3信息的原理很重要!搞清楚信息是怎么储存的后提取和分离输出都非常简单ww 如果有问题请私信/留言
参考资料: