作者:桂。
时间:2017-05-06 11:20:47
前言
本文主要记录librosa工具包的使用,librosa在音频、乐音信号的分析中经常用到,是python的一个工具包,这里主要记录它的相关内容以及安装步骤,用的是python3.5以及win8.1环境。
一、MIR简介
音乐信息检索(Music information retrieval,MIR)主要翻译自wikipedia.
MIR是从音乐中检索信息的跨学科科学,该领域需要心理学、乐理学、信号处理、机器学习等学科的背景知识。
目前MIR的商业应用主要包括:
推荐系统
目前音乐推荐的应用很多,但很少是基于MIR技术实现的,现在主流技术是通过人工标记或者用户的评论以及收听历史等简介数据进行分类判断,进而实现推荐,但事实上不同音乐本身的相似性是很多的
轨道分离及乐器识别
实现音乐的轨道分离,以及从音乐中识别出是何种乐器在演奏
自动录音
根据音乐自动转换成MIDI文件或者乐谱
音乐分类
根据音乐的产地、艺术家身份、音乐节奏等特征,借助机器学习方法进行音乐分类
自动生成音乐
利用数据库训练模式,让机器自主创造音乐
MIR领域涉及到的知识包括:
语料库:没有音乐库,利用机器学习挖掘历史出统计规律,是不够现实的
特征提取:例如常见的MFCC,是音色的一种度量,另外和弦、和声、节奏等音乐的特性,都需要合适的特征来进行表征
统计学习方法以及机器学习的相关知识
MIR用到的相关工具包可以参考isMIR主页。
二、Librosa功能简介
librosa对于MIR来讲就是特征提取的工具,当然一般音频分析也可以借用librosa。
A-主要功能
更多细节可以参考其主页。
音频处理
load:读取文件,可以是wav、mp3等格式;resample:重采样;get_duration:计算音频时长;autocorrelate:自相关函数;zero crossings:过零率;
频谱特性