好奇soundhound的搜索方法,在想能不能用到歌曲推荐上
略失望,和歌曲推荐需要的处理原音频还是差得有点远。。
稍微列一下这个专利里说的原理
1)不保存实际的歌曲音频,保存每个用户的查询片段,然后你来查新歌的话,就是和已经标记好的片段去匹配。有点类似监督学习
2)里面的一些名词。
tag:其实不是标签,就是声音片段。
key:tag经过一个算法——提取一些音频特征,声调,音量,持续时间什么的——转换成的一个量化的向量。
3)然后,就是匹配了。有点长,我就懒得看完了。
当要查询一个声音片段时,先按统一的算法,转换成key,然后按匹配算法,和数据库中保存的key匹配。
中间还有些细节,声音片段是切片的之类的,就不列了。
所以soundhound能搜索哼唱,其实他根本就不是去和原曲匹配- -b
tag和key的数据来源,略有提到,用些激励手段让用户录入