简介
这次是一次数据库实验,实验要求是了解最新的数据库,并使用!做一个简单案例使用。根据实际需要就采用了MongoDB 数据库,因为它是非关系数据库。使用比较简单,而且容易上手。案例是想爬取猫眼2018年上映的所有电影,并进行简单分析。然后进行电影推荐,可以输入一个电影,然后该系统采用推荐算法,推荐5部电影评分类型的电影。写下该博客就是为了记录。以免以后忘记!
环境要求
- 该项目使用了一个比较流行的服务器框架,Nodejs 的Express 服务器搭建框架。
- 也使用了简单的爬虫。基于python3.0 、java8.0
- 数据库:MongoDB4.0, Npm3.10 模块管理。
数据爬取
项目的第一步,就是准备相关的数据。
爬取目标
该项目爬取的电影数据,是2018年猫眼电影上映的电影数据。
分析该页html 结构,我们的目标就是获取索引页里所有电影链接,已经评分信息。
电影详情页
对详情页的信息进行获取,主要获取内容是电影名称、类型、国家、时长、上映时间、评分、评分人数以及累计票房。
反爬虫破解
通过 Beaut