本项目文档分为两部分:设计文档和实习报告
设计文档
一.项目说明
是否还在为想不起来看什么电影所苦恼?本网站创建的初衷在于满足广大观影爱好者对于电影的筛选与鉴别。方便大众提取自己所需要的电影。先叙述爬虫模块,本模块是对“豆瓣电影评分前250”的电影进行了爬取,爬取之后保存到数据库中,其中,爬取的电影包括属性:序号、名称、导演、演员、出版日期、观看量、评分等多类数据进行分析。存入数据库后,设计了网页,将爬取的数据进行前端展示。在展示过程中,我将数据进行了列表,图表等可视化分析。设计的还是比较美观,能直接从上面获取到的信息有:某一部电影的综合指数、最高分数的电影、还能在网页上面进行电影数据的再添加。功能满足每个影迷爱好者的观影需求。
二.功能构成
本网站的主要功能:对于电影的筛选与鉴别、包括属性:序号、名称、导演、演员、出版日期、观看量、评分等多类数据进行分析、某一部电影的综合指数、最高分数的电影、还能在网页上面进行电影数据的再添加等。
三.技术框架
1.编译环境:
Python3.8.2;
Django3.0.8;
Microsoft Windows [版本 10.0.18362.959]
Bootstrap3.3.7
2.编译器:
Pycharm2019.2
3.scrapy技术所需文件:
mysqlclient-1.4.6-cp38-cp38-win_amd64.whl
twisth-2.0.2-cp38-cp38-win_amd64.whl
四.ER图
五.需求概要分析
对于大众来说,满足了一定的需求,可以在众多优秀的电影中找到自己所需。对于个人而言,爬取的网站内容还是比较少,个人的精力都放在了对于前端网页的制作上,因此前端的需求更大。之后对于个人而言,肯定要去维护网站,使得网站更稳定,更有价值(大作业能有什么价值【bushi】)。
六.设计思路
先叙述scrapy模块,本模块是对“豆瓣电影评分前250”的电影进行了爬取,爬取之后保存到数据库中,其中,爬取的电影包括属性:序号、名称、导演、演员、出版日期、观看量、评分等多类数据进行分析。存入数据库后,设计了网页,将爬取的数据进行前端展示。在展示过程中,将数据进行了列表,图表等可视化分析。设计的还是比较美观,能直接从上面获取到的信息有:某一部电影的综合指数、最高分数的电影、还能在我的网页上面进行电影数据的再添加。
七.小结
结尾我就不再做过多的赘述。上文总结的差不多了,希望每个人都能找到自己心怡的电影!
汇报PPT
项目代码:
链接:https://pan.baidu.com/s/1bQMvPyiNEOqVQt-UdN6h0A
提取码:cenb