一、选题说明
选题背景
我原来想做旅游助手,感觉比较实用,而且因为现在POI推荐挺火,找数据集应该不是很难。可惜找到的数据集都是英文地点,测试友好度就不行(比如我想做一个猜你所想的功能,要怎么测啊)。转做电影助手,找到的整理好的数据集也是英文的,像是movielen的1M和10M数据集。但是,后来我找到豆瓣电影排行榜250。如下:
数据来源
根据以上叙述,我的数据都来自豆瓣了。原来设想用API来请求的,但是现在不能用了。改用爬虫获取。现在我拥有250个条目(为经典电影),还了解到豆瓣电影也提供开放API,后期可以扩展近期热门电影,即将上映电影。这样的话就可以有一个较好的知识库。
首先在排行榜上爬取电影的基本信息。
然后用获取到电影名,再通过豆瓣搜索功能,定为到这部电影,再获取它的简介。
数据模板:
电影(名称,导演,主演,年代,国家,类型[list],评分,热度,短评)
电影(名称,简介)
功能设想
- 猜你所想:这个就和猜动物的功能是一样的,用户心中拟定一部电影,程序通过一系列问题,猜出这部电影。
- 荐你所想:用户有自己的喜好,但是又不能明确表述。程序通过问用户一些列问题来引导用户并分析用户所想,然后做出推荐。这对于选择综合症的用户来说是个不错的选择。
- 热门推荐:简单但是效果良好的推荐方法就是分析一下所有电影,然后给出热门好评电影列表。
- 电影查询:用户可能已经知道了一些电影。想要更进一步的了解电影信息。此时程序就可以从知识库中找到这些电影的信息然后展示给用户。
- 电影搜索:大多数情况下用户想要查一些电影,但是可能不是清除地知道电影名称。这时候用户可根据已有地信息来搜索。比如这是张国荣的电影或者这是一部美国电影等等。
二、功能实现
猜你所想
这个是本软件的核心功能,也是最为复杂的功能。总体逻辑是通过问一些问一些问题,筛选出符合要求的电影列表,然后再问一些问题,直到电影列表收敛到只有一部或者没有电影输出结果。
简要逻辑如下:
确定电影制作国家和