facets:
1. Type:单声道复音(一种乐器,可同时多个音)
多声道复音(多条音轨,多种声音/乐器)
2. Destination and Use
3. Mode:有/无人为干预(Automated / interactive)
4. Style:数据集的选取
representations:
训练阶段:training input 生成阶段:generation input && generated output
音频与符号
representation的选择:音频/符号(连续变量/离散变量)(书中选择用符号表示)
音频:1)波形 waveform:属于原始音频信号表示方法(不利于信号存储和处理)
x:时间 y:信号的振幅
2)变换表示 transformed representation(数据压缩、丢失信息、引入偏见bias)
3)谱图 spectrum (常见),通过傅里叶变换得到
符号:
1. note 音符
a)pitch 音高:
- frequency(Hz)
- pitch notation(科学音调记号法): 音调+下标(0~9的离散,表示八度区)
音调+下标(0~9的离散,表示八度区)
音高和频率转换表
例:A4:在第4个八度区中的A调音,对应频率为440Hz
1)升一个八度:频率翻倍
十二