AI Composition(AI作曲)论文翻译&分析——Song From PI:A MUSICALLY PLAUSIBLE NETWORKFOR POP MUSIC GENERATION

简介

作者的灵感获得自youtube上的Song from PI。基于此,作者总结出了两点将随机性转换成音乐的规则: 1.任何一段随机的数字序列组成的信号都(totally)可以转化成好听的音乐;2.作曲家使用特定的规则(例如Harmernic Minor小调和声)将数字序列转换为乐谱。 作者使用分层RNN网络训练了一个pop music composer,将melody(旋律),chord(和弦),drums(鼓点融合在一起进行作曲。底层RNN用于训练melody,更高层分别训练chord和drums。作者将模型设定为音阶模式,让melody网络学习通常在特定音阶下演奏的音符。

乐理知识

·note:音符,乐曲的基本组成部分
·tone:音调,乐曲有12音调系统,即音符是12个为循环。12音调类型为:
在这里插入图片描述· bar:小节,对应于一定数量节拍(音符)的一小段时间。
· scale:音阶,subset of note,理解为音符的子集,即不会用到全部12音符,而只用到其中几个音符。常用的4种scale: Major(Minor),Harmernic Minor,Melodic Minor,Blues。每一个音阶指定了一系列相对的间隔,这些间隔和起始音符相关。所有的音阶都有一个7个音符的子集,除了Blues,它有6个。总共有48个不同的音阶,也就是四种音阶,每个音阶都可能从12个音符中的任意一个开始(4*12)。我们将Major和Minor看成是同一种,因为对于任意一个Major,都有一个Minor和它使用同一组音符,这叫关系小调。
· chord:和弦,一组一齐奏响的音符。
· The Circle of Fifth:五分之一圆通常用于产生和弦进行。 它将12个和弦起始音符映射到一个圆上。 从一个和弦更改为另一个和弦时,通常首选移到圆上的附近一个和弦,因为这会形成强烈的和弦进行,从而产生和谐感。

层级RNN进行pop music作曲

在这里插入图片描述整个网络在同一个scale上进行训练的,即整个曲子的scale不会改变,这虽然不符合真实作曲情况,但是有助于网络更好地去学习规律。 key层用于学习弹奏哪个音符,press层学习该音符的持续时间。key层和press层共同构成melody的学习层。作者假设鼓点和和弦是彼此独立的,所以只把melody层的信息分别传递给drum层和chord层。四层网络的输出即最终的音乐。由于限制了scale是相同的,这大大限制了音乐创作能力,虽然更容易操作,但这也是很大的不足和未来可改善空间。

Scale的角色

作者使用了midi-man数据集。由于scale的定义与起始音符是相关的,为了消除不同歌曲scale不同的影响,作者首先计算了歌曲在12个tone上的直方图,然后将其与48种scale下的tone相匹配,然后通过将所有音符进行移位,将保证scale以音符 C

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值