猎曲奇兵soundhound的原理

misssprite

于 2013-06-30 16:47:46 发布

阅读量2.5k

点赞数

分类专栏：学术算法文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/misssprite/article/details/9207991

版权

学术同时被 2 个专栏收录

6 篇文章

订阅专栏

1 篇文章

订阅专栏

好奇soundhound的搜索方法，在想能不能用到歌曲推荐上

网上看到说他们是有专利的，搜到专利：http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=%2Fnetahtml%2FPTO%2Fsearch-bool.html&r=1&f=G&l=50&co1=AND&d=PTXT&s1=%22System+method+storing+retrieving+non-text-based+information%22&OS=%22System+method+storing+retrieving+non-text-based+information%22&RS=%22System+method+storing+retrieving+non-text-based+information%22

略失望，和歌曲推荐需要的处理原音频还是差得有点远。。

稍微列一下这个专利里说的原理

1）不保存实际的歌曲音频，保存每个用户的查询片段，然后你来查新歌的话，就是和已经标记好的片段去匹配。有点类似监督学习

2）里面的一些名词。

tag：其实不是标签，就是声音片段。

key：tag经过一个算法——提取一些音频特征，声调，音量，持续时间什么的——转换成的一个量化的向量。

3）然后，就是匹配了。有点长，我就懒得看完了。

当要查询一个声音片段时，先按统一的算法，转换成key，然后按匹配算法，和数据库中保存的key匹配。

中间还有些细节，声音片段是切片的之类的，就不列了。

所以soundhound能搜索哼唱，其实他根本就不是去和原曲匹配- -b

tag和key的数据来源，略有提到，用些激励手段让用户录入

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。