技术:Java、JSP等
摘要:
随着互联网的普及,搜索引擎在中国异军突起,并且日益渗透到人们的日常生活中,在互联网普及之前,人们查询资料首先想到的是拥有大量书籍的图书馆。但今天很多人都会选择一种更方便、快捷、全面、准确的查阅方式--互联网。而越来越被重视的搜索引擎帮助我们在整个互联网上快速地查找到目标信息。对于文本内容的搜索已有非常成熟的技术,而对于多媒体内容的搜索,人们还在积极的探索之中。
本文的工作是研究并开发了多媒体信息中的音乐信息的搜索引擎系统。该系统提供了搜索音乐的途径,就是传统的按文本属性(如歌曲名,歌手,专辑)的搜索。
该系统的开发采用了一个用Java写的全文搜索引擎工具包Lucene,Lucene具有良好的开放性和易扩展性,应用它可以快速开发一个搜索引擎。
对于该搜索引擎搜索的数据,该系统设计了一个基于WebCollector的网络爬虫,通过该网络爬虫,抓取网络上的数据。WebCollector是不需要配置,并且便于二次开发的Java爬虫框架,用户可以在其基础上开发自己想要的爬虫。
该系统还设计了简洁美观的搜索界面,增强用户的搜索体验。
关键字:搜索引擎;音乐;Luence;网络爬虫
目录: