盲识音频分类,非监督和监督联合使用

        到了现在提笔忘字的年龄,将东西写下来也算是留下了点痕迹。别想着这个是个浪花,它涟漪都算不上。

        之前一个人在折腾着音频信息隐藏的想法。在处理完原始信息压缩后,希望将这些混合有其他信息的音频剥离出来,寻找一下之间的相同之处。由于本人并无乐理知识,耳朵也是一个木耳。对歌曲,音频的也只能听个响,所以根本不能从音频中区别不同的分类。目前对于音频市场的头部公司,从发布到订阅都构建了一套牢不可破的技术+资本的护城河。即使能从它们所建立的音频信息资料里薅出一点什么东西,那也是少之又少的。本想着靠自己去人工标注音频,但是这种想法,在大量消耗时间上是不可取的。(耳朵,时间,以及缺失的音频背后的理论知识,都会让部分人工标注充斥着个人主观色彩)

      既然都是学习,好吧,那就重新开始折腾大数据分析。好不容易找到了1700多首歌曲作为学习资源。拿到这些歌曲后,该怎么办?找资料,读论文,知道了首先要对所谓的特征提取,什么过零率,MFCC等。老老实实的一步一步来。自己做切片,做特征提取。这些都做完了,留在手里的只有一堆数据,怎么让这些数据发挥作用?一个人在解决这些问题时,很痛苦。没有人授业解惑,有时候很迷茫。因为拿到数据不知道怎么去做非监督和监督权责。监督数据从何而来?也只有认真的读书,好不容易在《机器学习》一书中找到有一句这样的话:可以将非监督产生的数据,用作监督学习里的样本使用。那么,在众多的非监督学习到底使用SVM 还是KMeans?经过多次的测试,发现SVM对小数据量样本可以适用。但是对于我自己胡乱搞的这个特征模型却是无法接受。在提取时,我将歌曲切片,并按时间线随机提取切片,并组成40秒的特征数据,差不多 有 300多w行的数据。SVM在运算时由于运算的机制会造成内存溢出,就寻思着换为KMeans聚类。

       使用KMeans,对于K的初始选值,取决于经验模型。受测歌曲中有多少分类,我根本不知道。在人工搜索部分歌曲的曲风分类后,暂定K=10。(K值的选择直接影响分类效果)当然一些小众的歌曲参照网上的曲风流派似乎也不那么靠谱。例如子曰秋野的歌曲。通过KMeans分类输出,再根据模型的结构,会得到一组样本的分组比例,在经过贝叶斯提取。得到样本一个整体的分类(这里只是样本的一个相对分类。因为受测样本中不同时域的特征可能归属于不同的分类。但是对于单个的受测样本,就需要将所有的时域分类汇总后,求出最大的分类比例,作为相对分类)。KMeans处理完毕后,将得到的分类数据和特征数据作为下一步的非监督数据。

       现在的神经网络太多,由于自己懒再加上学渣身份,没有去学习Tensorflow(感觉自己落后了好多)。我才用了Accord的深度信任网络(DBN)。有50个隐层,按照KMeans 的K值,设置了10个输出层。由于 DBN支持 非监督和监督,为了利用之前的产出数据,所以将之前得到的输出数据作为DBN的学习样本,进行50次反向传播的监督学习,错误率在2%左右趋向于3%,学习时间达到了2个多小时。然后再将受测体制作为时间线不等的模型数据放入DBN进行估算。估算时间很短,最后也是得出的一组与受测体条目一致的分类数据,按照之前非监督的分类提取方式,就可以暂估这个受测体的相对分类。

      我在整理非监督分类的时候,发现了一件很有意思的事情。 在我的样本库里,收集了200多首周杰伦的歌曲,当分类出来后,居然发现,周杰伦的歌曲70%以上的分类是一致的,他的其他歌曲也很有规律的落到剩下的3个分类。然后,我找了他的一首《给我一首歌的时间 live》(周杰伦和蔡依林的演唱会版本)进行受测,居然,和样本库里的这首歌的专辑版本一致。然后我又用他的《说好不哭》受测,也是在样本库他的歌曲的最大分类里。和它最像的《稻香》,《窃爱》,《爸我回来了》等等。当然这些统计都与歌曲切片提取特征有关。

       写在最后,这篇完全是笔记,没有多少的干活。唯一要记住,对于歌曲的特征,切片会直接影响分类。同时在做非监督时,余弦距离比欧氏距离来的友好程度更好。看完的也谢谢您们,耐心的听一个人在这里发牢骚。

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值