在 关于音频情感分类的随笔(1)中有提到,没有人工标注信息下,采用了无监督学习的分类,作为学习的基础。这样由于缺少黄金标准,导致后续产出的数据,在分析过程中无法甄别出具体的所属情感。那么是不是可以利用人为首先去标注音乐以及音乐片段的情感呢?我个人以为或许不然。其有三个大的方面。
其一音乐是文娱的产物,截止今天,流传的音乐数量很多。如果需要人工标注,需要消耗大量的人力和金钱去投入。对于体量不大的公司以及势单力薄的个人无疑是天方夜谭;其二音乐其实建立在时间的基础上的。音乐的递进也是随着时间的消逝一样。那么 即使人工标注也需要消耗等额的时间。如果100首音乐,标注者都会等额消耗相同的时间。在标注的时间段里,也无暇去处理下一首歌的标注。其三,音乐产生的共情是一个很主观的个人感受,当一个标注者,处于不同时间或环境范围中,对同一首音乐的共情都不会一样。(不难想象,一首平静的和一首悲伤的音乐在大体上是十分接近的)如果要拿到绝对准确的标注,几乎不可能实现。即使只要求拿到相对的标注,也需要采用统计方法,将分门别类的音乐,同时邀请多个标注者试听,然后取每首分类情感较多的作为标准。这样对1000首歌可以,10000首,10w首音乐情绪分类又该怎么办呢?(请回述到第二)
我对音乐情绪的分类,最近也才理解,我是想找出音乐所产生的最大的共情方向。为什么这么说呢?收听者十分快乐,此时他听到一首悲伤的音乐,他的选择是继续听完呢,还是切换下一首?因为收听者(受众)无法与当前的音乐产生共情。只有产生共情后,才会接受音乐的情绪递进。
以上只是个人主观且片面的言辞,我们还是言归正传,记录下本次的信息数据。为了测试模型的通用性,找了 《仙剑2》的林坤信的配乐,黑豹乐队,以及国外的有部分标注的音乐片段,共计112首。这些受测音乐的时间分布在 30s到5分钟之间。类型有歌曲,配乐。区分有电音,摇滚,民谣等等。其中无匹配46首,多为配乐。这里的无匹配也不是没有获得分类数据。只是根据分类数据无法辨别音乐的情绪。(因为我根据分类数据展示的特征中又对分类数据做了最后一次情感定义)。以下表1,为检测返回数据
歌曲 | 标志 | 标注 |
activation.wav | Pleased | 音乐片段令人高兴 |
too-many-addictions.wav | Happy | 音乐片段令人快乐 |
feeling-fine.wav | Relaxed | 音乐片段令人放松 |
my-summer-love.wav | Happy | 音乐片段令人快乐 |
to.wav | Calm | 音乐片段令人平静 |
activation_1.wav | Pleased | 音乐片段令人高兴 |
o.wav | Relaxed | 音乐片段令人放松 |
afraid-of-destiny.wav | Sad | 音乐片段令人悲伤 |
inside.wav | Sad | 音乐片段令人悲伤 |
other-rivers-i.wav | Nervous | 音乐片段令人有些忧郁 |
perfect-time.wav | Calm | 音乐片段令人平静 |
take-my-body.wav | Happy | 音乐片段令人快乐 |
le-dernier-jour-de-lautomne.wav | Nervous | 音乐片段令人有些忧郁 |
cowboy-tears.wav | Pleased | 音乐片段令人轻快 |
teiwaz.wav | Relaxed | 音乐片段令人放松 |
snowfall.wav | Nervous | 音乐片段令人有些忧郁 |
woodbones.wav | Nervous | 音乐片段令人有些焦虑 |
differential-pressure.wav | Excited | 音乐片段令人兴奋 |
prosthetic-valve.wav | Excited | 音乐片段令人兴奋 |
voiceless.wav | Excited | 音乐片段令人兴奋 |
雨(特别保留版).wav | nomatch | 无匹配 |
蝶恋(特别保留版).wav | nomatch | 无匹配 |
终曲.wav | Relaxed | 音乐片段令人放松 |
红尘路缈 .wav | Nervous | 音乐片段令人有些忧郁 |
蝶恋 IV.wav | nomatch | 无匹配 |
雨 II.wav | nomatch | 无匹配 |
势如破竹.wav | Excited | 音乐片段令人兴奋 |
逆天而行.wav | Excited | 音乐片段令人兴奋 |
遇袭.wav | nomatch | 无匹配 |
心忐忑.wav | nomatch | 无匹配 |
灵怨.wav | Excited | 音乐片段令人兴奋 |
看尽前尘.wav | nomatch | 无匹配 |
颓城.wav | Happy | 音乐片段令人快乐 |
神佑.wav | nomatch | 无匹配 |
救黎民.wav | Excited | 音乐片段令人兴奋 |
兵凶战危.wav | Excited | 音乐片段令人兴奋 |
梦醒.wav | Pleased | 音乐片段令人轻快 |
忧.wav | nomatch | 无匹配 |
回梦.wav | Calm | 音乐片段令人平静 |
灵山.wav | Sad | 音乐片段令人悲伤 |
来世再续未了缘.wav | nomatch | 无匹配 |
神木林.wav | Pleased | 音乐片段令人高兴 |
御剑伏魔 II.wav | nomatch | 无匹配 |
御剑伏魔 I.wav | Excited | 音乐片段令人兴奋 |
繁华看尽.wav | nomatch | 无匹配 |
救佳人.wav | Excited | 音乐片段令人兴奋 |
醉仙驱魔.wav | nomatch | 无匹配 |
魂萦梦牵.wav | nomatch | 无匹配 |
蝶满春园 II.wav | nomatch | 无匹配 |
美景_0.wav | nomatch | 无匹配 |
嬉春.wav | nomatch | 无匹配 |
春色无边.wav | nomatch | 无匹配 |
蝶恋 III.wav | nomatch | 无匹配 |
春风恋牡丹.wav | nomatch | 无匹配 |
十面埋伏.wav | Excited | 音乐片段令人兴奋 |
大开眼界.wav | Excited | 音乐片段令人兴奋 |
心急如焚.wav | nomatch | 无匹配 |
险境.wav | nomatch | 无匹配 |
危机.wav | nomatch | 无匹配 |
鬼阴山.wav | Excited | 音乐片段令人兴奋 |
历险.wav | nomatch | 无匹配 |
蝶恋 II.wav | Relaxed | 音乐片段令人放松 |
宿命.wav | nomatch | 无匹配 |
云谷鹤峰 III .wav | nomatch | 无匹配 |
蒙难.wav | Excited | 音乐片段令人兴奋 |
血海余生.wav | nomatch | 无匹配 |
腥风血雨.wav | Excited | 音乐片段令人兴奋 |
凌云壮志.wav | nomatch | 无匹配 |
罗汉阵.wav | nomatch | 无匹配 |
鬼影幢幢.wav | Pleased | 音乐片段令人高兴 |
情牵.wav | nomatch | 无匹配 |
小桥流水.wav | Pleased | 音乐片段令人高兴 |
情怨 II.wav | nomatch | 无匹配 |
侠客行.wav | Excited | 音乐片段令人兴奋 |
战意昂.wav | Excited | 音乐片段令人兴奋 |
富甲一方.wav | nomatch | 无匹配 |
步步为营.wav | nomatch | 无匹配 |
比武招亲.wav | Excited | 音乐片段令人兴奋 |
风光.wav | Excited | 音乐片段令人兴奋 |
今生情不悔.wav | Relaxed | 音乐片段令人放松 |
盟誓.wav | Nervous | 音乐片段令人有些焦虑 |
风起云涌.wav | nomatch | 无匹配 |
惊.wav | nomatch | 无匹配 |
酒剑仙.wav | Excited | 音乐片段令人兴奋 |
戏仙.wav | nomatch | 无匹配 |
孤雀无栖.wav | Sad | 音乐片段令人悲伤 |
云谷鹤峰 II.wav | nomatch | 无匹配 |
乐逍遥.wav | nomatch | 无匹配 |
余杭春日.wav | nomatch | 无匹配 |
晨光.wav | nomatch | 无匹配 |
蝶恋 I.wav | Sad | 音乐片段令人悲伤 |
桃花幻梦.wav | nomatch | 无匹配 |
白河寒秋.wav | nomatch | 无匹配 |
雨 I.wav | nomatch | 无匹配 |
蝶舞春园.wav | nomatch | 无匹配 |
情怨 I.wav | Pleased | 音乐片段令人高兴 |
窥春.wav | Calm | 音乐片段令人平静 |
云谷鹤峰 I.wav | nomatch | 无匹配 |
fug.wav | Pleased | 音乐片段令人高兴 |
acrobat.wav | Calm | 音乐片段令人平静 |
we will rock you1 | Excited | 音乐片段令人兴奋 |
we will rock you | Excited | 音乐片段令人兴奋 |
黑豹-脸谱all | Excited | 音乐片段令人兴奋 |
黑豹-脸谱1 | Excited | 音乐片段令人兴奋 |
section6-闹鬼的地下室全 | Sad | 音乐片段令人悲伤 |
section6-鬼哭全 | Nervous | 音乐片段令人有些焦虑 |
section6-二泉映月全 | Sad | 音乐片段令人悲伤 |
section6-梁祝全 | Sad | 音乐片段令人悲伤 |
section送别15s | Sad | 音乐片段令人悲伤 |
section6-走音广告 | Annoying | 音乐片段令人有些烦人 |
section6-毛不易-别再闹了_8.wav | Sad | 音乐片段令人悲伤 |
section6-告白气球伴奏new | nomatch | 无匹配 |
在整个测试数据中,平静和悲伤的音乐在部分节奏上,相似点很多重合。可能在辨别时不容易区别。例如:https://icons8.com/music中很对归属与悲伤的音乐也同时存在平静的分类中。当然也不光是 平静和悲伤不容易区别,还有快乐和高兴,轻快和放松。在测试数据中,发现轻快的特征中,某一项分类值高于放松的特征指标。主要体现在节奏特征的变化上。
就目前40.2%的错误辨别率来说,识别音乐情感的模型还十分糟糕。本想找到合适的解惑书籍来看,但是又不知道什么样的书籍适合。。呵呵,陷入了两难。