关于音频情感分类的随笔(2)

        在 关于音频情感分类的随笔(1)中有提到,没有人工标注信息下,采用了无监督学习的分类,作为学习的基础。这样由于缺少黄金标准,导致后续产出的数据,在分析过程中无法甄别出具体的所属情感。那么是不是可以利用人为首先去标注音乐以及音乐片段的情感呢?我个人以为或许不然。其有三个大的方面。

        其一音乐是文娱的产物,截止今天,流传的音乐数量很多。如果需要人工标注,需要消耗大量的人力和金钱去投入。对于体量不大的公司以及势单力薄的个人无疑是天方夜谭;其二音乐其实建立在时间的基础上的。音乐的递进也是随着时间的消逝一样。那么 即使人工标注也需要消耗等额的时间。如果100首音乐,标注者都会等额消耗相同的时间。在标注的时间段里,也无暇去处理下一首歌的标注。其三,音乐产生的共情是一个很主观的个人感受,当一个标注者,处于不同时间或环境范围中,对同一首音乐的共情都不会一样。(不难想象,一首平静的和一首悲伤的音乐在大体上是十分接近的)如果要拿到绝对准确的标注,几乎不可能实现。即使只要求拿到相对的标注,也需要采用统计方法,将分门别类的音乐,同时邀请多个标注者试听,然后取每首分类情感较多的作为标准。这样对1000首歌可以,10000首,10w首音乐情绪分类又该怎么办呢?(请回述到第二)

      我对音乐情绪的分类,最近也才理解,我是想找出音乐所产生的最大的共情方向。为什么这么说呢?收听者十分快乐,此时他听到一首悲伤的音乐,他的选择是继续听完呢,还是切换下一首?因为收听者(受众)无法与当前的音乐产生共情。只有产生共情后,才会接受音乐的情绪递进。

以上只是个人主观且片面的言辞,我们还是言归正传,记录下本次的信息数据。为了测试模型的通用性,找了 《仙剑2》的林坤信的配乐,黑豹乐队,以及国外的有部分标注的音乐片段,共计112首。这些受测音乐的时间分布在 30s到5分钟之间。类型有歌曲,配乐。区分有电音,摇滚,民谣等等。其中无匹配46首,多为配乐。这里的无匹配也不是没有获得分类数据。只是根据分类数据无法辨别音乐的情绪。(因为我根据分类数据展示的特征中又对分类数据做了最后一次情感定义)。以下表1,为检测返回数据

歌曲

标志

标注

activation.wav

Pleased

片段令人高

too-many-addictions.wav

Happy

片段令人快

feeling-fine.wav

Relaxed

片段令人放松

my-summer-love.wav

Happy

片段令人快

to.wav

Calm

片段令人平静

activation_1.wav

Pleased

片段令人高

o.wav

Relaxed

片段令人放松

afraid-of-destiny.wav

Sad

片段令人悲

inside.wav

Sad

片段令人悲

other-rivers-i.wav

Nervous

片段令人有些

perfect-time.wav

Calm

片段令人平静

take-my-body.wav

Happy

片段令人快

le-dernier-jour-de-lautomne.wav

Nervous

片段令人有些

cowboy-tears.wav

Pleased

片段令人

teiwaz.wav

Relaxed

片段令人放松

snowfall.wav

Nervous

片段令人有些

woodbones.wav

Nervous

片段令人有些焦

differential-pressure.wav

Excited

片段令人兴奋

prosthetic-valve.wav

Excited

片段令人兴奋

voiceless.wav

Excited

片段令人兴奋

(保留版).wav

nomatch

无匹配

蝶恋(保留版).wav

nomatch

无匹配

终曲.wav

Relaxed

片段令人放松

红尘路缈 .wav

Nervous

片段令人有些

蝶恋 IV.wav

nomatch

无匹配

II.wav

nomatch

无匹配

势如破竹.wav

Excited

片段令人兴奋

逆天而行.wav

Excited

片段令人兴奋

.wav

nomatch

无匹配

心忐忑.wav

nomatch

无匹配

灵怨.wav

Excited

片段令人兴奋

看尽前.wav

nomatch

无匹配

颓城.wav

Happy

片段令人快

神佑.wav

nomatch

无匹配

救黎民.wav

Excited

片段令人兴奋

兵凶.wav

Excited

片段令人兴奋

梦醒.wav

Pleased

片段令人

.wav

nomatch

无匹配

回梦.wav

Calm

片段令人平静

灵山.wav

Sad

片段令人悲

来世再未了.wav

nomatch

无匹配

神木林.wav

Pleased

片段令人高

伏魔 II.wav

nomatch

无匹配

伏魔 I.wav

Excited

片段令人兴奋

看尽.wav

nomatch

无匹配

救佳人.wav

Excited

片段令人兴奋

醉仙.wav

nomatch

无匹配

.wav

nomatch

无匹配

春园 II.wav

nomatch

无匹配

美景_0.wav

nomatch

无匹配

嬉春.wav

nomatch

无匹配

春色无.wav

nomatch

无匹配

蝶恋 III.wav

nomatch

无匹配

恋牡丹.wav

nomatch

无匹配

十面埋伏.wav

Excited

片段令人兴奋

大开眼界.wav

Excited

片段令人兴奋

心急如焚.wav

nomatch

无匹配

险境.wav

nomatch

无匹配

危机.wav

nomatch

无匹配

鬼阴山.wav

Excited

片段令人兴奋

历险.wav

nomatch

无匹配

蝶恋 II.wav

Relaxed

片段令人放松

宿命.wav

nomatch

无匹配

云谷 III .wav

nomatch

无匹配

.wav

Excited

片段令人兴奋

血海余生.wav

nomatch

无匹配

血雨.wav

Excited

片段令人兴奋

凌云壮志.wav

nomatch

无匹配

罗汉阵.wav

nomatch

无匹配

鬼影幢幢.wav

Pleased

片段令人高

.wav

nomatch

无匹配

流水.wav

Pleased

片段令人高

情怨 II.wav

nomatch

无匹配

侠客行.wav

Excited

片段令人兴奋

战意昂.wav

Excited

片段令人兴奋

富甲一方.wav

nomatch

无匹配

步步为营.wav

nomatch

无匹配

比武招.wav

Excited

片段令人兴奋

风光.wav

Excited

片段令人兴奋

今生情不悔.wav

Relaxed

片段令人放松

盟誓.wav

Nervous

片段令人有些焦

风起云涌.wav

nomatch

无匹配

.wav

nomatch

无匹配

.wav

Excited

片段令人兴奋

戏仙.wav

nomatch

无匹配

孤雀无栖.wav

Sad

片段令人悲

云谷 II.wav

nomatch

无匹配

乐逍遥.wav

nomatch

无匹配

余杭春日.wav

nomatch

无匹配

晨光.wav

nomatch

无匹配

蝶恋 I.wav

Sad

片段令人悲

桃花幻梦.wav

nomatch

无匹配

白河寒秋.wav

nomatch

无匹配

I.wav

nomatch

无匹配

蝶舞春园.wav

nomatch

无匹配

情怨 I.wav

Pleased

片段令人高

窥春.wav

Calm

片段令人平静

云谷鹤峰 I.wav

nomatch

无匹配

fug.wav

Pleased

片段令人高

acrobat.wav

Calm

片段令人平静

we will rock you1

Excited

片段令人兴奋

we will rock you

Excited

片段令人兴奋

黑豹-脸谱all

Excited

片段令人兴奋

黑豹-脸谱1

Excited

片段令人兴奋

section6-闹鬼的地下室全

Sad

片段令人悲

section6-鬼哭全

Nervous

片段令人有些焦

section6-二泉映月全

Sad

片段令人悲

section6-梁祝全

Sad

片段令人悲

section15s

Sad

片段令人悲

section6-走音广告

Annoying

片段令人有些

section6-毛不易-别再闹了_8.wav

Sad

片段令人悲

section6-告白气球伴奏new

nomatch

无匹配

 

在整个测试数据中,平静和悲伤的音乐在部分节奏上,相似点很多重合。可能在辨别时不容易区别。例如:https://icons8.com/music中很对归属与悲伤的音乐也同时存在平静的分类中。当然也不光是 平静和悲伤不容易区别,还有快乐和高兴,轻快和放松。在测试数据中,发现轻快的特征中,某一项分类值高于放松的特征指标。主要体现在节奏特征的变化上。

就目前40.2%的错误辨别率来说,识别音乐情感的模型还十分糟糕。本想找到合适的解惑书籍来看,但是又不知道什么样的书籍适合。。呵呵,陷入了两难。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值