网易云音乐搜索引擎 python+whoosh---(1)背景和环境介绍

这篇博客讲述了作者如何使用Python的Whoosh库构建一个网易云音乐搜索引擎,作为《互联网信息搜索与挖掘》课程作业的一部分。内容涵盖了数据来源、数据库处理、搜索引擎构建以及交互式界面的实现。文章跳过了爬虫部分,专注于搜索引擎和界面设计,最终实现了一个能够进行自由搜索并根据用户点击历史调整排名的功能。
摘要由CSDN通过智能技术生成

最近做《互联网信息搜索与挖掘》的课程作业,作业要求是做一个网易云音乐搜索引擎。

基本要求是:

1,【自由搜索】输入歌曲名称可以返回一系列排序后的歌曲,搜索歌手会根据热门度或其他条件返回一系列歌曲,或者,搜索关键字获取歌曲名或歌词中含有关键字的歌曲列表;

2,【搜索历史权重排名】当用户点击播放时,记录用户点击事件,并调整排名。(例如,下次用户搜索这条信息时把他点击的这首歌往前放)

下面我会跳过爬虫部分,讲述搜索引擎和界面的实现过程。

 

由于班长负责爬虫爬网易云音乐数据,我负责搜索引擎和界面,所以我的博客只讲我这一部分,就是爬到网易云音乐数据之后的这部分、搜索引擎和界面怎么做。

 

主要思路是这样的,班长python爬虫存下来网易云音乐的数据,music.db,我根据这个数据再用python+whoosh做搜索引擎,python+ajax写网页页面作为交互式界面。

我们的数据信息是这样的:

一共有四张表格,字段信息分别见表格中所示的,黄色部分是我想要的。

由于我们课程要求数据库内只要有1w首歌曲以上就可以了,我删除了很多没有爬到歌词的数据,最后数据库从十几万

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值