音乐检索
文章平均质量分 94
yutianzuijin
目前从事语音识别相关的工作。
展开
-
音乐检索简介
1 基于文本的检索音乐检索从方式上来分主要有两种:基于文本的检索和基于内容的检索。基于文本的检索是通过输入歌曲名、歌手名或者歌词来检索歌曲,此方式是目前最通用的方式。它通过对音乐库中的音乐进行特征标记完成,每首音乐都有歌名、歌手和歌词信息;用户检索时往往利用倒排索引进行关键词检索。基于文本检索的前提是用户知道歌曲的一些信息,这种方式在大多数情况下可以满足用户需求。但是这个限制在某些情况下是一个原创 2014-03-18 10:42:00 · 11958 阅读 · 12 评论 -
Java与C之间的socket通信
最近正在开发一个基于指纹的音乐检索应用,算法部分已经完成,所以尝试做一个Android App。Android与服务器通信通常采用HTTP通信方式和Socket通信方式。由于对web服务器编程了解较少,而且后台服务器已经采用原始socket实现与c客户端通信,这就要求Android客户端也采用socket实现。所以在开发Android app时采用了原始socket进行编程。由于算法是用C语言原创 2014-04-30 18:03:14 · 45625 阅读 · 14 评论 -
基于指纹的音乐检索原理详述
在前面的博客基于指纹的音乐检索中,我们介绍了其基本流程,但是对于检索的具体实现并未做过多介绍,本博客将详细叙述检索的具体原理和实现。1 搜索引擎的工作原理 在介绍音乐检索的原理之前,我们先介绍一下搜索引擎的工作原理,这是因为音乐检索的工作原理和搜索引擎的工作原理非常类似。 我们使用搜索引擎的时候,通常是这个流程:输入一些关键词,提交给搜索引擎,搜索引擎通过后台分原创 2014-07-04 22:16:27 · 11272 阅读 · 8 评论 -
《Shazam It! Music Recognition Algorithms, Fingerprinting, and Processing》译文
最近看到一篇老外写的博客,简单介绍了shazam的工作原理。图非常好,所以就把它翻译成中文,希望对搞听歌识曲的人有帮助。你可能遇到这样的场景:在酒吧或者餐厅听到你非常熟悉的歌,也许你曾经听过无数次,并且被歌曲忧伤的旋律深深打动。久违之后的邂逅让你依然心动,所以想再次欣赏这首歌,但是却突然不记得名字了!明明就在嘴边,但就是说不出来!这时如果你手机上装有音乐识别软件,那么问题就很容易解决了。你只需翻译 2015-05-01 10:25:07 · 9420 阅读 · 8 评论 -
《An Industrial-Strength Audio Search Algorithm》译文
随着微信摇一摇逐渐被大众所广泛使用,听歌识曲功能也开始被关注。目前来看,像音乐雷达和微信摇一摇都采用了经典的shazam算法,为了使大家对shazam算法更加了解,我将其经典论文进行了翻译,希望对大家学习shazam算法有所帮助。一个企业级的音频搜索算法摘要 我们设计实现并实际部署了一套灵活性很高的音频搜索引擎。核心算法抗噪声和扰动能力强,计算复杂度低,同时具有很高的可翻译 2015-11-11 22:44:15 · 9139 阅读 · 2 评论 -
《Non-Negative Matrix Factorization for Polyphonic Music Transcription》译文
NMF(非负矩阵分解),由于其分解出的矩阵是非负的,在一些实际问题中具有非常好的解释,因此用途很广。在此,我给大家介绍一下NMF在多声部音乐中的应用。要翻译的论文是利用NMF转录多声部音乐的开山之作,浅显易懂地介绍了如何利用NMF对钢琴曲进行乐谱翻译,值得一看。摘要 在本文中我们提出一种新方法用来分析由固定谐波格式的音符构成的复调乐曲片段(例如钢琴音符)。由于音符结构固翻译 2015-12-30 20:19:41 · 3953 阅读 · 1 评论 -
基于指纹的音乐检索
基于指纹的音乐检索是一种新型的音乐检索方式,它让用户录制一段正在播放的音乐,然后上传到服务器进行匹配,最后返回对应的歌曲信息。与哼唱检索相比,它适用范围更广,使用也更加方便。基于指纹的音乐检索核心是从原始的波形音乐中提取指纹,然后利用指纹进行匹配。指纹可以看做一首歌的哈希值,相同的歌有相同的指纹,不同的歌有不同的指纹。但是和哈希值不同,一首歌的指纹并不是一个单独的数字或者字符串,而是一个附属有原创 2014-03-19 18:06:00 · 22772 阅读 · 12 评论 -
大页内存(HugePages)在通用程序优化中的应用
今天给大家介绍一种比较新奇的程序性能优化方法—大页内存(HugePages),简单来说就是通过增大操作系统页的大小来减小页表,从而避免快表缺失。这方面的资料比较贫乏,而且网上绝大多数资料都是介绍它在Oracle数据库中的应用,这会让人产生一种错觉:这种技术只能在Oracle数据库中应用。但其实,大页内存可以算是一种非常通用的优化技术,应用范围很广,针对不同的应用程序,最多可能会带来50%的性能提升原创 2014-12-13 20:04:04 · 28740 阅读 · 7 评论