关于音频情感分类的随笔（2）

最新推荐文章于 2024-09-14 19:18:15 发布

Erice

最新推荐文章于 2024-09-14 19:18:15 发布

阅读量377

点赞数

分类专栏：音频分类音乐情感文章标签：机器学习大数据

本文链接：https://blog.csdn.net/Erice/article/details/110524988

版权

音频分类同时被 2 个专栏收录

7 篇文章 1 订阅

订阅专栏

音乐情感

6 篇文章 0 订阅

订阅专栏

在关于音频情感分类的随笔（1）中有提到，没有人工标注信息下，采用了无监督学习的分类，作为学习的基础。这样由于缺少黄金标准，导致后续产出的数据，在分析过程中无法甄别出具体的所属情感。那么是不是可以利用人为首先去标注音乐以及音乐片段的情感呢？我个人以为或许不然。其有三个大的方面。

其一音乐是文娱的产物，截止今天，流传的音乐数量很多。如果需要人工标注，需要消耗大量的人力和金钱去投入。对于体量不大的公司以及势单力薄的个人无疑是天方夜谭；其二音乐其实建立在时间的基础上的。音乐的递进也是随着时间的消逝一样。那么即使人工标注也需要消耗等额的时间。如果100首音乐，标注者都会等额消耗相同的时间。在标注的时间段里，也无暇去处理下一首歌的标注。其三，音乐产生的共情是一个很主观的个人感受，当一个标注者，处于不同时间或环境范围中，对同一首音乐的共情都不会一样。（不难想象，一首平静的和一首悲伤的音乐在大体上是十分接近的）如果要拿到绝对准确的标注，几乎不可能实现。即使只要求拿到相对的标注，也需要采用统计方法，将分门别类的音乐，同时邀请多个标注者试听，然后取每首分类情感较多的作为标准。这样对1000首歌可以，10000首，10w首音乐情绪分类又该怎么办呢？（请回述到第二）

我对音乐情绪的分类，最近也才理解，我是想找出音乐所产生的最大的共情方向。为什么这么说呢？收听者十分快乐，此时他听到一首悲伤的音乐，他的选择是继续听完呢，还是切换下一首？因为收听者（受众）无法与当前的音乐产生共情。只有产生共情后，才会接受音乐的情绪递进。

以上只是个人主观且片面的言辞，我们还是言归正传，记录下本次的信息数据。为了测试模型的通用性，找了《仙剑2》的林坤信的配乐，黑豹乐队，以及国外的有部分标注的音乐片段，共计112首。这些受测音乐的时间分布在 30s到5分钟之间。类型有歌曲，配乐。区分有电音，摇滚，民谣等等。其中无匹配46首，多为配乐。这里的无匹配也不是没有获得分类数据。只是根据分类数据无法辨别音乐的情绪。（因为我根据分类数据展示的特征中又对分类数据做了最后一次情感定义）。以下表1，为检测返回数据

歌曲	标志	标注
activation.wav	Pleased	音乐片段令人高兴
too-many-addictions.wav	Happy	音乐片段令人快乐
feeling-fine.wav	Relaxed	音乐片段令人放松
my-summer-love.wav	Happy	音乐片段令人快乐
to.wav	Calm	音乐片段令人平静
activation_1.wav	Pleased	音乐片段令人高兴
o.wav	Relaxed	音乐片段令人放松
afraid-of-destiny.wav	Sad	音乐片段令人悲伤
inside.wav	Sad	音乐片段令人悲伤
other-rivers-i.wav	Nervous	音乐片段令人有些忧郁
perfect-time.wav	Calm	音乐片段令人平静
take-my-body.wav	Happy	音乐片段令人快乐
le-dernier-jour-de-lautomne.wav	Nervous	音乐片段令人有些忧郁
cowboy-tears.wav	Pleased	音乐片段令人轻快
teiwaz.wav	Relaxed	音乐片段令人放松
snowfall.wav	Nervous	音乐片段令人有些忧郁
woodbones.wav	Nervous	音乐片段令人有些焦虑
differential-pressure.wav	Excited	音乐片段令人兴奋
prosthetic-valve.wav	Excited	音乐片段令人兴奋
voiceless.wav	Excited	音乐片段令人兴奋
雨(特别保留版).wav	nomatch	无匹配
蝶恋(特别保留版).wav	nomatch	无匹配
终曲.wav	Relaxed	音乐片段令人放松
红尘路缈 .wav	Nervous	音乐片段令人有些忧郁
蝶恋 IV.wav	nomatch	无匹配
雨 II.wav	nomatch	无匹配
势如破竹.wav	Excited	音乐片段令人兴奋
逆天而行.wav	Excited	音乐片段令人兴奋
遇袭.wav	nomatch	无匹配
心忐忑.wav	nomatch	无匹配
灵怨.wav	Excited	音乐片段令人兴奋
看尽前尘.wav	nomatch	无匹配
颓城.wav	Happy	音乐片段令人快乐
神佑.wav	nomatch	无匹配
救黎民.wav	Excited	音乐片段令人兴奋
兵凶战危.wav	Excited	音乐片段令人兴奋
梦醒.wav	Pleased	音乐片段令人轻快
忧.wav	nomatch	无匹配
回梦.wav	Calm	音乐片段令人平静
灵山.wav	Sad	音乐片段令人悲伤
来世再续未了缘.wav	nomatch	无匹配
神木林.wav	Pleased	音乐片段令人高兴
御剑伏魔 II.wav	nomatch	无匹配
御剑伏魔 I.wav	Excited	音乐片段令人兴奋
繁华看尽.wav	nomatch	无匹配
救佳人.wav	Excited	音乐片段令人兴奋
醉仙驱魔.wav	nomatch	无匹配
魂萦梦牵.wav	nomatch	无匹配
蝶满春园 II.wav	nomatch	无匹配
美景_0.wav	nomatch	无匹配
嬉春.wav	nomatch	无匹配
春色无边.wav	nomatch	无匹配
蝶恋 III.wav	nomatch	无匹配
春风恋牡丹.wav	nomatch	无匹配
十面埋伏.wav	Excited	音乐片段令人兴奋
大开眼界.wav	Excited	音乐片段令人兴奋
心急如焚.wav	nomatch	无匹配
险境.wav	nomatch	无匹配
危机.wav	nomatch	无匹配
鬼阴山.wav	Excited	音乐片段令人兴奋
历险.wav	nomatch	无匹配
蝶恋 II.wav	Relaxed	音乐片段令人放松
宿命.wav	nomatch	无匹配
云谷鹤峰 III .wav	nomatch	无匹配
蒙难.wav	Excited	音乐片段令人兴奋
血海余生.wav	nomatch	无匹配
腥风血雨.wav	Excited	音乐片段令人兴奋
凌云壮志.wav	nomatch	无匹配
罗汉阵.wav	nomatch	无匹配
鬼影幢幢.wav	Pleased	音乐片段令人高兴
情牵.wav	nomatch	无匹配
小桥流水.wav	Pleased	音乐片段令人高兴
情怨 II.wav	nomatch	无匹配
侠客行.wav	Excited	音乐片段令人兴奋
战意昂.wav	Excited	音乐片段令人兴奋
富甲一方.wav	nomatch	无匹配
步步为营.wav	nomatch	无匹配
比武招亲.wav	Excited	音乐片段令人兴奋
风光.wav	Excited	音乐片段令人兴奋
今生情不悔.wav	Relaxed	音乐片段令人放松
盟誓.wav	Nervous	音乐片段令人有些焦虑
风起云涌.wav	nomatch	无匹配
惊.wav	nomatch	无匹配
酒剑仙.wav	Excited	音乐片段令人兴奋
戏仙.wav	nomatch	无匹配
孤雀无栖.wav	Sad	音乐片段令人悲伤
云谷鹤峰 II.wav	nomatch	无匹配
乐逍遥.wav	nomatch	无匹配
余杭春日.wav	nomatch	无匹配
晨光.wav	nomatch	无匹配
蝶恋 I.wav	Sad	音乐片段令人悲伤
桃花幻梦.wav	nomatch	无匹配
白河寒秋.wav	nomatch	无匹配
雨 I.wav	nomatch	无匹配
蝶舞春园.wav	nomatch	无匹配
情怨 I.wav	Pleased	音乐片段令人高兴
窥春.wav	Calm	音乐片段令人平静
云谷鹤峰 I.wav	nomatch	无匹配
fug.wav	Pleased	音乐片段令人高兴
acrobat.wav	Calm	音乐片段令人平静
we will rock you1	Excited	音乐片段令人兴奋
we will rock you	Excited	音乐片段令人兴奋
黑豹-脸谱all	Excited	音乐片段令人兴奋
黑豹-脸谱1	Excited	音乐片段令人兴奋
section6-闹鬼的地下室全	Sad	音乐片段令人悲伤
section6-鬼哭全	Nervous	音乐片段令人有些焦虑
section6-二泉映月全	Sad	音乐片段令人悲伤
section6-梁祝全	Sad	音乐片段令人悲伤
section送别15s	Sad	音乐片段令人悲伤
section6-走音广告	Annoying	音乐片段令人有些烦人
section6-毛不易-别再闹了_8.wav	Sad	音乐片段令人悲伤
section6-告白气球伴奏new	nomatch	无匹配

在整个测试数据中，平静和悲伤的音乐在部分节奏上，相似点很多重合。可能在辨别时不容易区别。例如：https://icons8.com/music中很对归属与悲伤的音乐也同时存在平静的分类中。当然也不光是平静和悲伤不容易区别，还有快乐和高兴，轻快和放松。在测试数据中，发现轻快的特征中，某一项分类值高于放松的特征指标。主要体现在节奏特征的变化上。

就目前40.2%的错误辨别率来说，识别音乐情感的模型还十分糟糕。本想找到合适的解惑书籍来看，但是又不知道什么样的书籍适合。。呵呵，陷入了两难。