痛点,机器扒谱或者人工智能生成的乐谱往往很混乱,没考虑过给人弹,甚至不能区分钢琴左右手,这里可以科普下要做的方向
节奏量化:因为人唱的往往和节拍有误差,而机器扒谱实在太准了,需要解决扒谱后对齐的问题
乐谱雕刻:midi只在某个打谱软件上兼容,而musicxml是反复横跳的(来自于B虾佬的提醒),把midi转musicxml是一个很重要的工作,参考scoretransformer(当然这个人不愿意公开模型)
乐谱重排:扒出来的谱,左右手不能区分,声部混杂,可以考虑声部分离,左右手分离,在保持声音特征不变的情况下分解为,左手和弦和右手主旋律可弹的谱,这里又涉及到一个乐谱重排(上面这个人的工作,依然没开源,但有数学方法做)
调号检测:检测key,这方面对于专业人士要用,正常听个响就行
指法分配:有关于丰富点吉他指法(模仿特定风格或者合理分配这两篇论文),钢琴指法(研究只有几个)
速度更改:这是最重要一个,扒谱出来的往往是120速度时间戳记录的音符音高,实际上你的速度并不是,这个在某个算法解决了,目前我用了一个,还看到了一两个,这个能随便解决乐谱乐段乐句划分的问题
歌词转录:有whisper+gpt(甚至gpt也能转录简单旋律),做出的歌词转录不错,被称为歌词转录天才
歌词时间戳:有个项目已经很准,每一句都划分出来开始结束时间,经过测试效果可以。当然还有歌词节拍分词对齐这种,对于出简谱不错
音乐标签:音乐结构检测的标签,能帮助你剪辑视频什么,或者副歌提取即可