python电影推荐系统 github_GitHub - qingtang3009/MovieRecommend: 一个电影推荐系统-CSDN博客

本文链接：https://blog.csdn.net/weixin_42468321/article/details/114449473

本文介绍了一个基于Python和Django的电影推荐系统，涵盖了用户登录、评分和推荐功能。系统使用协同过滤算法，用户可以对观看的电影评分，点击推荐按钮获取个性化的电影列表。项目已在GitHub上开源，适用于学习和研究。

摘要由CSDN通过智能技术生成

MovieRecommend

一个电影推荐系统(本科毕业设计)——实现用户登录、评分、推荐，采用协同过滤算法。🌸

作者序

我完成毕业设计的时间线可以参考README末尾的笔记，请注意笔记中所记载的内容和最后的实际成果有所出入，只做为本人完成毕业设计的过程记录。

本毕设为2018年所做，和当前主流技术有所出入，大家可以利用深度学习算法来改进推荐结果。

系统流程

用户注册、登录系统，对看过的电影进行评分，点击提交评分按钮，再点击查看推荐按钮即可看见推荐的电影列表。项目主页以及推荐结果如下：

如何使用

1.首先将项目克隆到本地，用Pycharm打开movierecommend文件夹，并install项目依赖

2.将用到的csv文件导入mysql数据表中，详见数据库建表，配置好数据库；注意数据库相关代码(settings.py、views.py)可能都要进行修改以符合实际情况；(本项目端口号为3307,用户为root,密码为admin,database为MovieData);

3.命令行执行:

python manage.py makemigrations

python manage.py migrate

python manage.py runserver

点击http://127.0.0.1:8000/ 即可查看注册登录以及评分页面。

注意登录后点击电影海报下面的星星对该电影评分，之后还要点击左上角的“提交评分”按钮才能将该评分数据存入mysql中，否则代码会报错。

项目依赖

1.Python3.6+django1.11 (python3.5亦可)

2.MySQL5.6

3.Jquery+CSS3+Html5

数据库建表处理

1.在MySQL中创建一个database，取好名字，比如MovieData；

2.在该数据库中创建moviegenre3和users_resulttable两张表,建表命令行如下：

CREATE TABLE moviegenre3(imdbId INT NOT NULL PRIMARY KEY,title varchar(300),poster varchar(600));

CREATE TABLE users_resulttable(userId INT NOT NULL,imdbId INT,rating DECIMAL(3,1));

3.通过命令行或者navicat等工具将项目data文件夹下的两张csv表分别导入上面创建好的两张table中。由于moviegenre3.csv中的超链接较复杂，建议使用navicat工具导入；users_resulttable表可以使用下面命令行导入：

load data infile "E:/MovieRecommend/data/users_resulttable.csv" into table users_resulttable fields terminated by ',' lines terminated by '\n' (userId,imdbId,rating);

注意，此表没有主键，增加主键操作为:

alter table users_resulttable add column id int auto_increment PRIMARY KEY;

问题

1.由于在views.py的查询推荐结果的代码中直接将查询sql写死为select * from users_resulttable WHERE userId = 1001，可能会报keyerror:1001的错误。如果报错请检查users_resulttable表的末尾是否存入了userId=1001的用户评分记录，如果没有，很可能是用户没有点击提交评分按钮将数据插入数据表造成的。如果要进行第二个用户的注册和登录推荐，要将sql改为userId=1002或者先将user表中所存用户信息删除。

2.如果通过命令行将csv导入数据库表报错‘The MySQL server is running with the --secure-file-priv option so it cannot execute this statement’，则是mysql版本问题，建议使用5.6版本。如果使用5.7版本出现此问题，修改mysql文件夹下的my.ini文件，增加secure_file_priv=语句，并且在service服务里面重启mysql即可。

3.执行迁移时出现问题建议删除迁移文件重新迁移。

4.如有其他问题可邮件致信我：mahappyending@gmail.com

笔记

2018年2月18日

寒假过的好快啊，前一阵子准备用flask，但是后面进一步了解之后决定用django+mysql+python完成这个推荐系统，现在就在懵懵懂懂的学django

2018/4/5

UserCF是给用户推荐和他有共同兴趣爱好的用户喜欢的电影，ItemCF是给用户推荐那些和他之前喜欢的电影类似的电影。

目前已经实现UserCF部分算法，模拟了用户-电影矩阵数据，对已有用户里的某一位用户进行电影推荐。之后的工作就是要从csv中获取数据。

看了《推荐系统实践》这本书，后期可能用基于标签，但是基于标签算法涉及更多，每部电影都需要多个标签，不能用movielens数据集。

2018/4/7

今天尝试用了pycharm，之前一直用的sublime，但是文件管理的比较混乱。用pycharm的时候遇到坑了，我系统按安装的是django1.11,

但是pycharm里面安装的是最新版本2.0，导致项目文件自带的代码有错误。后来又卸了重新安装，统一成了1.11.0版本。

接下来是mysql，项目迁移如下：

python manage.py makemigrations

这只是生成了迁移文件，还要执行迁移文件

python manage.py migrate

2018/4/8

进行一下流程梳理：

1.先启动mysql:net start mysql;mysql -u root -p;

2. create database [数据库名字];

3.pycharm直接创建一个django项目，然后进入这个项目下

4.在settings.py 中,数据库代码为：

DATABASES = {

'default': {

'ENGINE': 'django.db.backends.mysql',

'NAME': '[数据库名字]',

'PASSWORD': '[自己设置一个密码]',

'HOST': '127.0.0.1',

'USER': 'root',

'PORT': '',

}

5.在_init_.py中： import pymysql; pymysql.install_as_MySQLdb()

6.models.py:加入模型类，属性等。

7.生成迁移文件：python manage.py makemigrations;执行迁移：python manage.py migrate;

8.在mysql>中：use [数据库名]; show tables;

在项目文件下，python manage.py runserver 浏览器中输入127.0.0.1:8000

9.在templates下写html文件，然后和views.py视图文件、urls.py文件进行匹配

2018/4/10

今天搭建了django的虚拟开发环境，安装了virtualenv，一定要保证整个项目都在虚拟环境中运行。 django1.11.1

关于html文件调用js、css等文件：首先在建的app目录下建一个static文件，分支如下

├─migrations

│ └─__pycache__

├─static

│ ├─css

│ ├─img

│ └─js

└─__pycache__

注意migrations和static文件同级。html文件开头要加上 {% load staticfiles %}，引入css的语句为：

python

如果纯粹像写前端那样调用css、js是不能成功的。

输入'http://127.0.0.1:8000/users/login/'，返回用户登录界面

点击登录后进入推荐系统首页(目前的首页只有一个电影分类页面，之后应增加分页，以及实现用户对电影评分，数据库记录用户对电影的评分)

2018/4/12

今天找到了另一个csv文件，里面含有电影海报的链接，这样可以直接用Js动态获取链接然后加载图片；

还有由于有很多个csv文件，每个文件包含的内容都不一样，所以要将各个文件合并。准备直接用mysql的多表查询。花了很久才成功把csv导入进mysql表中的ratings.

2018/4/13

注意result表里面要存电影的名字，而名字里面很多不确定的特殊符号，比如有逗号，冒号等。所以不能加enclosed by '"'这句，否则csv导进mysql表时会中断。

4/14

今天做的很少，主要都去看深度学习视频了，为以后的研究生项目扫盲。

主要还是csv和Mysql的问题，不知道要怎么去遍历里面的数据。之前是自己模拟的几个用户对电影进行评分，用的是列表类型，我就想能不能读取csv然后转为列表再操作。

4/20

由于之前创建表时，不小心将rating设为了int型，所以今天重新建了一张表改为DECIMAL，名为resultTable。而且增加了主键:id。

‘alter table resultTable add column id int auto_increment PRIMARY KEY;’是给表增加一列并设为自增主键。

现在前端页面已经可以获取图片的imdbId号和评分，接下来就是获取当前用户的名字，给他分一个从669开始的userId号。然后插入imdbId号和rating，调用算法进行分析。

4/25

今天实现了可以从前端页面获取评分的电影的rating和imdbId号并存入users_resulttable中，还要解决的是给登录用户自动分配一个userId号，与他的评分相对应。

之后要实现算法从数据库中获取数据得出推荐结果。现在没有存title，后面得出推荐结果了就通过查询imdbId号得到海报和title。

还实现了index.html显示用户登录信息。

重新根据model生产数据表要将所有的迁移文件都删除才能生成成功。

4/26

实现了给每个用户分配一个id，其实是在原有的user.id基础上加1000.

然后将算法导入pycharm，并且实现了可以将mysql数据表导出为csv文件。

现在的Mysql表是user_resulttable，同csv文件，csv文件导出到static下。明天的任务是通过按钮将其连贯起来。

4/27

poster2从moviegenre7.txt导入。

对users_resulttable的处理：

alter table users_resulttable drop column id;

load data local infile "e:/Moviedatabase/rrtotaltable.csv" into table users_resulttable fields terminated by ',' lines terminated by '\n' (userId,imdbId,rating);

alter table users_resulttable add column id int auto_increment PRIMARY KEY;

费劲周折终于实现了从数据库里获取海报链接并且显示在html上。

但是，还没有实现从recommend函数得到的imdbId中查询到poster再显示。可能要将imdbId存到数组里再循环查询。

而且还有个问题，就是现在页面一刷新数据库里就会出现重复的值。

4/28

有个最大的问题，现在imdbId和poster对应的表不完整，很多推荐出来的ImdbId号找不到电影海报。

必须要解决这个问题，而且最好增加title。现已解决select查询语句遍历recommend函数输出的数组。

4/29

到今天为止，毕设基本已经完成。且增加了用户注销按钮。

但有几点不足：

1.推荐页面的排版样式未设计 2.运行速度有点慢 3.只用了一种推荐算法 4.每次刷新都在重新生成推荐列表，应该去除这种效果，刷新不应该变动。

4/30