Hadoop网剧推荐系统的设计与实现 计算机专业毕设源码63839

摘 要

大数据时代下,数据呈爆炸式地增长。为了迎合信息化时代的潮流和信息化安全的要求,利用互联网服务于其他行业,促进生产,已经是成为一种势不可挡的趋势。在网剧的要求下,开发一款整体式结构的网剧推荐系统,将复杂的系统进行拆分,能够实现对需求的变化快速响应、系统稳定性的保障,能保证平台可持续、规模化发展的要求。

本文研究的网剧推荐系统完善了对应的软体架设以及程序编码的工作,系统采用java语言、Hadoop框架、MVC模式、MySQL数据库进行业务系统的编码及其开发,实现了本系统的全部功能。同时完成网剧推荐系统的基本功能:电视剧浏览、新闻资讯、网剧类型、评论等。

关键词:网剧推荐系统;整体式结构;Mysql数据库

Design and Implementation of Hadoop Online Drama Recommendation System

Abstract

IIn the era of big data, data is growing explosively. In order to meet the trend of the information age and the requirements of information security, using the Internet to serve other industries and promote production has become an irresistible trend. Under the requirements of online drama, develop a holistic structure of online drama recommendation system, which can split complex systems, achieve rapid response to changes in demand, ensure system stability, and ensure the requirements of sustainable and large-scale development of the platform.

The online drama recommendation system studied in this article improves the corresponding software setup and program coding work. The system uses Java language, Hadoop framework, MVC mode, and MySQL database to code and develop the business system, achieving all the functions of the system. At the same time, it completes the basic functions of the online drama recommendation system: TV series browsing, news information, online drama types, comments, and so on.

Key words:Online drama recommendation system; Integral structure; Mysql database

目  录

第1章 绪论

1.1 研究背景与意义

1.2 开发现状

第2章 开发工具及相关技术介绍

2.1 Hadoop框架介绍 2

2.2 MySQL 数据库 2

2.3 B/S结构 3

2.4 JAVA技术 3

2.5 MVVM模式介绍 3

第3章 系统分析

3.1 可行性分析

3.1.1 技术可行性

3.1.2 经济可行性

3.1.3 操作可行性

3.2 需求分析

3.3 系统业务流程分析

3.4 系统数据流程分析

第4章 系统设计

4.1 系统架构设计

4.2 系统功能结构

4.3 功能模块设计

4.4 数据库设计

4.4.1 概念模型设计

4.4.2 逻辑结构设计

第5章 系统实现

5.1 登录模块的实现

5.2 用户子系统模块的实现

5.3 管理员子系统模块的实现

第6章 系统测试

6.1 测试目的

6.2 测试用例

6.3 测试结果

第7章 总结与展望

参考文献

致谢

  1. 绪论
    1. 研究背景与意义
网络信息技术的发展,使得信息逐渐过载,在过载的信息中,网剧信息由于其自身特性,更加引人注目,由此出现了形式多变的网剧网站。网剧网站上过多的网剧信息导致人们很难从海量的网剧信息中得到自己想要获取的网剧信息,但是人们对网剧信息的需求又十分迫切,推荐系统较好地解决了网剧信息过载的问题。网剧网站使用推荐系统向用户进行个性化网剧推荐,通过对用户的观看记录等信息进行分析,把用户可能感兴趣的网剧推荐给用户,大大提升了用户的使用体验。作为网剧网站,采取较好的网剧推荐系统,有效地向用户推荐其感兴趣的网剧,才会吸引更多的用户访问,并且节省费用,所以对网剧推荐系统进行研究是十分必要的。本文对网剧推荐系统的算法和应用研究进行分析,并针对网站提出在推荐网剧时存在的问题和改进建议。
    1. 开发现状
随着互联网的普及﹐近几年来﹐视频网站的发展越来越火热﹐其以方便﹐快捷的优势冲击着传统媒体﹐2006“视频网站元年”﹐国内的视频网站更是增加到了180家左右﹐热门的如优酷视频﹑腾讯视频﹑爱奇艺视频等。如今﹐随着各种移动终端如手机﹑平板电脑的普及﹐加上3G、4G网络和WIFI网络的覆盖﹐人们不需再担心缺乏设备和网速差等各种问题。各种精彩的电影﹐搞笑的小短片﹐文艺小清新的微电影﹐还有各种直播视频等随时随地都可以观看﹐受到了广大观众的青睐﹐特别是对于普及度最广的青年广众﹐对于他们来说﹐视频网站就是生活的一部分。然而﹐作为一个视频网站﹐除了具有巨大的视频资源Z外﹐不能仅仅停留在为每一个用户都推荐热门和新发布的视频上面﹐而是要去探索如何根据用户的个人喜好米订制开推存忧频个日本大H中B喜爱﹐这是从众多视频网站中脱颖而出成为一个优秀的视频网站需要面对的一个难题﹐因此也就有了视频推荐。在海量的视频资源中﹐视频推荐能根据用户的个人喜好﹑搜索和观看历史等为不同的用户推荐适合该用户观看的视频﹐即个性化推荐。这种个性化推荐能让用户进入视频网站时看到适合自己的视频﹐减小了从让人眼花缭乱的视频中挑选的难题﹐增强用户对视频网站的用户体验,这种个性化的服务是视频网站“收买”人心并获得经济效益的好方法。

优酷是中国领先的视频分享网站﹐其推荐系统可以大致分为两部分﹐第一部分是底层的算法架构﹐主要做算法的研究工作;第二部分是上层的支撑架构﹐即大数据的支撑平台。主要用于将海量视频信息﹐快速实时的推荐给用户﹐实现良好的用户体验在视频行业中,用户行为的收集是一个视频网站极其重视的部分。对此﹐网剧推荐系统也成立了专项小组﹐对用户行为进行收集,在新的架构之上﹐包括之前没有办法收集的用户实时访问的视频数据﹐用户搜索行为﹑访问的页血﹐现在都可以实现实时朵集﹐并引入到实时的算法当中去;同时,在数据的更新频率上﹐优酷将更新频率分为了三钟类型﹐用以实现更加快速实时的用户体验。未来的网剧推荐系统也会在系统构架上做的更加实时﹐以便更加准确﹑快速地对用户进行分析﹐通过用户行为﹐朵用机器自动聚合出标签﹐用标签的形式来给用户做出类似的内容推荐﹐将更大程度地提升对用户的个性化服务体验。

  1. 开发工具及相关技术介绍
    1. Hadoop框架介绍

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。Hadoop的框架最核心的设计就是:HDFSMapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。

    1. MySQL 数据库

MySQL 是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL 所使用的 SQL 语言是用于访问数据库的最常用标准化语言。因为其自身的功能相当强大,目前已成为最为流行的数据库软件之一[7]。

MySQL是一个开放源码的小型关联式数据库管理系统,开发者为瑞典MySQL AB公司。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库[8]。

    1. B/S结构

系统计划采用BS模式,是因为比传统的C/S结构具有明显的优越性。B/S模式也就是浏览器/服务器模式,它的界面部分是在浏览器端展示,而主要工作是由服务器端进行实现的,用户的请求由浏览器端提交给服务器端进行处理,而服务器将处理结果反馈给浏览器端,在浏览器端界面描画给用户查看。采用B/S模式不仅可以避免用户必须安装专业软件才能开发系统或者访问系统的局限性,而且更加便利。

    1. JAVA技术

Java主要采用CORBA技术和安全模型,可以在互联网应用的数据保护。它还提供了对EJB(Enterprise JavaBeans)的全面支持,java servlet API,SSM(java server pages),和XML技术。

JAVA语言功能:

面向对象:面向对象是Java编程语言的标志之一,是一种软件开发方法。最重要的是将所有东西变成对象,然后以某种方式编程。编程时,代码和数据写在每个对象上。 面向对象编程方法的出现使得人们在编程过程中的设计思考和操作变得非常简单,同时也提高了程序的安全性。

跨平台:Java流行的一个关键特性是它的跨平台特性,这使得用Java编程变得容易。您可以用Java编写程序并在其他地方运行它,而无需在编译后更改它。

垃圾回收机制:用来将那些在程序不操作时无用的对象所占用的内存空间释放掉,C ++最被人厌恶的就是因为其不能将在编程的过程中所占用的内存空间进行及时的释放,导致随着编程时间的变长所占用的内存空间越来越多。对于一些编程高手而言,他们会在刚开始编程的时候配置一块内存地址放在堆栈上,然后在不需要的时候会对其进行释放,而一些新手和菜鸟在很多的时候会忘记删除这个内存地址,从而导致程序在运行的过程中会变得十分的不稳定,最终有可能会导致程序崩溃。所以很多C ++的高手在编写程序时往往都会将删除后的指针的值设置为NULL,然后在删除之前确定一个指针的值是否为NULL。

    1. MVVM模式介绍

MVVM是Model-View-ViewModel的简写。它本质上就是MVC 的改进版。MVVM 就是将其中的View 的状态和行为抽象化,让我们将视图 UI 和业务逻辑分开。当然这些事 ViewModel 已经帮我们做了,它可以取出 Model 的数据同时帮忙处理 View 中由于需要展示内容而涉及的业务逻辑。微软的WPF带来了新的技术体验,如Silverlight、音频网剧3D动画……,这导致了软件UI层更加细节化、可定制化。同时,在技术层面,WPF也带来了 诸如Binding、Dependency Property、Routed Events、Command、DataTemplate、ControlTemplate等新特性。MVVM(Model-View-ViewModel)框架的由来便是MVP(Model-View-Presenter)模式与WPF结合的应用方式时发展演变过来的一种新型架构框架。它立足于原有MVP框架并且把WPF的新特性糅合进去,以应对客户日益复杂的需求变化。

  1. 系统分析
    1. 可行性分析

在软件开发的过程中系统的可行性分析是必不可少的,可行性的研究就是评估问题是否能得到解决并且是要以最少的时间和最少的代价来解决。为实现上面的目标还要必须考虑到解决这些问题的方法的优点和缺点,还要考虑到实现了这些系统规模的开发带来的经济效益。这里可以用技术的可行性,操作的可行性,经济的可行性对我们的系统进行可行性的研究。网剧推荐系统的可行性分析如下所示:

      1. 技术可行性

网剧推荐系统采用的是Hadoop技术并于MVVM模式,数据库部分采用的是当前流行的MYSQL数据库,网剧推荐系统中的所有数据资源都存储在Mysql数据库中,本系统多处采用了AJAX的异步操作,AJAX技术可以对用户指定部分的数据进行局部刷新,不仅减少了服务器对页面的解析而且极大增加了用户的体验度。本系统的环境配置也较为简单,因为用的是HBuilder编辑器,而HBuilder里面有自带的Apache服务器和JDK环境,因此不需要我们在重新配置。

本系统采用Java、Mysql来支持事务和数据逻辑用H5来做前台页面的显示。

HTML网页中的不同组成成分是采用标签的形式来进行标识的。以下是HTML的基本的组成布局:

 

图3-1 HTML基本构成图

      1. 经济可行性

网剧推荐系统是在Hadoop和Mysql的环境中运行的,而系统的成本也只是主要分布在软件的开发和维护上。但如果系统上线投入使用之后,不仅可以方便人们,还节省了用户的时间和精力,而且还极大限度的方便了运营者,减少了运营者的工作强度。网剧推荐系统其实也不太复杂,在开发的时候经济支出也不大,在开发系统时时间用的也不多,从时间的优势和对经济利益方面产生的好处远超过维护和管理的成本,所以开发此系统是可行合适的。

      1. 操作可行性

本系统是基于浏览器和服务器的网剧推荐系统,系统开发完成之后用户只需要在浏览器中输入正确的URL地址即可进行访问。本系统的前台页面简单明了,在没有操作指导的情况下也可以进行操作,无论是系统管理员还是普通用户在页面中所有的操作都是在浏览器中完成的,因此只要电脑在有网络的情况下,打开浏览器都能操作。而且在使用之前也不用进行相关的环境配置,因此本系统方便、简单、易于使用,所以该系统是容易并且可操作的。

    1. 需求分析

根据用户对系统的需求,要求系统简单操作,能够准确,完整的对信息进行管理。网剧推荐系统在对需求做解析后,整个系统主要分为两个部分:管理员和普通用户,每个模块下的分支功能不一样。对功能做出如下说明:

管理员模块:后台首页管理、网站公告管理、资源管理(新闻资讯、新闻分类)、系统用户管理、模块管理(电视剧分类、电视剧、电视剧评分、联系我们、网站数据)。

用户模块:用户注册与登录、网站公告、新闻资讯、电视剧(包括电视剧类别、推荐、评分、点赞、收藏等)、个人账户等。

用户用例图如下所示。

 

图3-1 用户用例图

管理员用例图如下所示。

 

图3-1 管理员用例图

根据用例图,对一些重要的用例进行描述。

注册用例描述如下表所示。

表3-1 注册用例描述

用例名称

注册

参与者

用户

描述

用户填写相关信息完成注册成为系统的用户

前置条件

后置条件

用户填写相关信息并用户账号可用

事件流

  1. 用户点击注册按钮
  2. 用户填写相关信息
  3. 用户确认并提交信息
  4. 系统提示注册成功

补充说明

  1. 系统检测用户所输信息如不符合要求则提示并返回注册界面
  2. 系统检测用户所输账号不可用或已存在则提示并返回注册界面

登录用例描述如下表所示。

表3-1 登录用例描述

用例名称

登录

参与者

用户

描述

用户填写用户名和密码登录系统

前置条件

用户已注册

后置条件

用户名和密码正确

事件流

(1)用户在登录页面输入用户名和密码

(2)系统检测用户输入的用户名和密码

(3)显示登录成功并返回主页面

补充说明

(a)系统检查除密码不正确,返回登录页面

个人信息管理用例描述如下表所示。

表3-1 个人信息管理用例描述

用例名称

管理个人信息

参与者

用户

描述

用户查看、修改个人信息

前置条件

用户已登录

后置条件

事件流

(1)用户查看个人信息

(2)用户修改个人信息

补充说明

(a)用户可修改密码

(b)用户可修改联系方式

留言用例描述如下表所示。

表3-1 联系我们用例描述

用例名称

联系我们

参与者

用户

描述

用户点击联系我们

前置条件

用户已登录

后置条件

留言内容不违规

事件流

(1)在页面输入主题、反馈内容、联系电话

(2)提交

补充说明

(a)留言内容不能为空

评论用例描述如下表所示。

表3-1 评论用例描述

用例名称

评论

参与者

用户

描述

用户发表评论

前置条件

用户已登录

后置条件

评论内容不违规

事件流

(1)在评论页输入评论数据,提交评论

(2)更新并显示评论板

补充说明

(a)评论内容不能为空

电视剧分类用例描述如下表所示。

表3-1 电视剧分类用例描述

用例名称

电视剧分类

参与者

管理员

描述

管理员执行电视剧分类操作

前置条件

管理员已登录

后置条件

该网剧存在,并且能被进行分类

事件流

(1)在网剧页点击要进行分类的网剧

(2)填写电视剧分类数据

补充说明

(a)电视剧分类表单数据不能为空

电视剧用例描述如下表所示。

表3-1 电视剧用例描述

用例名称

电视剧管理

参与者

管理员

描述

管理员提供新增、修改、删除、查阅等功能

前置条件

  1. 管理员成功登录系统
  2. 管理员可以对已存在的电视剧进行修改和删除

后置条件

事件流

(1)管理员查看修改电视剧

(2)管理员添加电视剧

(3)管理员删除电视剧

补充说明

(a)新添加的电视剧不符合要求时会添加失败

(b)修改的电视剧不符合要求时会修改失败

    1. 系统业务流程分析

网剧推荐系统的业务流程如下图所示。

 

图3-3 系统业务流程图

管理员拥有最高权限,在对各项信息进行增加、删除、修改后会更新后台数据库的内容,用户在登录进行电视剧资讯浏览、网站公告、新闻资讯、个人账户、个人收藏、电视剧等指令动作同样会更新后台数据。

    1. 系统数据流程分析

与强调控制逻辑的程序流程图不同,它更关心的是整个系统中数据的具体流动以及数据的加工处理的整个客观过程,是对数据规格的说明。也正因如此,系统数据流图作为系统结构化分析方法中极为重要的一种描述工具备受青睐。

网剧推荐系统的顶层数据流如下图所示。

图3-4系统顶层数据流图

 

系统顶层数据流:外部实体为用户,第一个流程为登录验证,用户信息表返回密码验证,是否正确,正确则登录系统,错误则反馈信息,登录系统后,根据不同用户的功能选择,来读写数据库。

系统底层数据流如下图所示。

 

图3-5系统底层数据流图

系统底层数据流:外部实体为管理员和普通用户,数据流分别有管理员和普通用户流向系统数据流程,数据表提供数据支持,来完成逻辑操作。

  1. 系统设计
    1. 系统架构设计

网剧推荐系统采用三层开发设计模式,分为:用户界面层,业务逻辑层和数据访问层。用户界面层用来和用户交互,业务逻辑层负责业务的处理和各层之间的数据的传递;数据访问层负责对数据库的访问和检索。

系统的架构图如下图所示。

图4-1 系统架构图

 

系统各层之间的调用过程如下:

(1)用户通过用户界面层访问系统,向系统提交请求,界面层对请求进行初步的处理和包装,并判断是否要与业务逻辑层进行交互。

(2)业务逻辑层接收来自界面层的请求,对请求进行数据处理。然后调用数据访问层来实现数据库访问,数据访问层访问数据库,将数据读出并返回给逻辑层。

(3)逻辑层将处理的结果,返回给界面层。界面层加以处理呈现给用户。

    1. 系统功能结构

进入系统后首先要进行登录,验证你的身份,赋予你不同的权限。当你成功登录后,页面会有多个板块,分别是个人账户管理、电视剧资讯管理、电视剧分类管理、电视剧信息管理。里面界面简单易懂,根据标示可以直接进行方便快捷的操作。

系统功能结构图如下所示。

 

图4-2系统功能结构图

    1. 功能模块设计

管理员账户的基本信息管理。主要提供管理员账户的基本信息录入、删除、维护和查询等功能,包括:

管理员录入管理员账户基本信息;

管理员更新、增加及删除管理员账户基本信息;

用户根据管理员账户 ID 查询基本信息;

系统管理员更改个人密码;

评论的基本信息管理。主要提供评论的基本信息录入、修改和查询功能,包括:

用户录入评论基本信息;

管理员更新、增加及删除评论基本信息;

管理员根据评论 ID 查询评论基本信息;

电视剧分类的基本信息管理。主要是提供电视剧分类的基本信息录入、维护和查询功能,包括:

用户录入电视剧分类基本信息;

用户更新、增加及删除电视剧分类基本信息;

用户根据电视剧分类 ID 查询电视剧分类基本信息;

电视剧的基本信息管理。主要提供电视剧的基本信息录入、删除、维护和查询功能, 包括:

管理员录入电视剧信息;

管理员更新、增加电视剧基本信息;

管理员根据电视剧 ID 查询电视剧基本信息;

用户根据个人信息导航栏查询电视剧信息;

    1. 数据库设计

一个好的系统它的后台数据库一定要考虑的全面,这和我们建造房子一个概念,房子不是随心所欲建起来的,一切都是在合理设计的基础是实现的,地基打牢固了房子才能建的更高。数据库如果设计的很合理,而且每个方面都能考虑到了那么这个系统才能不会出现大的问题。

      1. 概念模型设计

本系统在数据库中存放了多张表,分别是用户表、评论表、资讯表、电视剧分类表、电视剧信息表。

系统的主要实体间关系E-R图如下图所示。

 

图4-7系统E-R图

      1. 逻辑结构设计

此环节把概念转变成数据。由于整个数据库所处理的信息过多,就只展示几个表。

    1. 表access_token (登陆访问时长)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

token_id

int

10

0

N

Y

临时访问牌ID

2

token

varchar

64

0

Y

N

临时访问牌

3

info

text

65535

0

Y

N

4

maxage

int

10

0

N

N

2

最大寿命:默认2小时

5

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

6

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

7

user_id

int

10

0

N

N

0

用户编号:

    1. 表article (文章:用于内容管理系统的文章)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

article_id

mediumint

8

0

N

Y

文章id:[0,8388607]

2

title

varchar

125

0

N

Y

标题:[0,125]用于文章和html的title标签中

3

type

varchar

64

0

N

N

0

文章分类:[0,1000]用来搜索指定类型的文章

4

hits

int

10

0

N

N

0

点击数:[0,1000000000]访问这篇文章的人次

5

praise_len

int

10

0

N

N

0

点赞数

6

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

7

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

8

source

varchar

255

0

Y

N

来源:[0,255]文章的出处

9

url

varchar

255

0

Y

N

来源地址:[0,255]用于跳转到发布该文章的网站

10

tag

varchar

255

0

Y

N

标签:[0,255]用于标注文章所属相关内容,多个标签用空格隔开

11

content

longtext

2147483647

0

Y

N

正文:文章的主体内容

12

img

varchar

255

0

Y

N

封面图

13

description

text

65535

0

Y

N

文章描述

    1. 表article_type (文章分类)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

type_id

smallint

5

0

N

Y

分类ID:[0,10000]

2

display

smallint

5

0

N

N

100

显示顺序:[0,1000]决定分类显示的先后顺序

3

name

varchar

16

0

N

N

分类名称:[2,16]

4

father_id

smallint

5

0

N

N

0

上级分类ID:[0,32767]

5

description

varchar

255

0

Y

N

描述:[0,255]描述该分类的作用

6

icon

text

65535

0

Y

N

分类图标:

7

url

varchar

255

0

Y

N

外链地址:[0,255]如果该分类是跳转到其他网站的情况下,就在该URL上设置

8

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

9

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

    1. 表auth (用户权限管理)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

auth_id

int

10

0

N

Y

授权ID:

2

user_group

varchar

64

0

Y

N

用户组:

3

mod_name

varchar

64

0

Y

N

模块名:

4

table_name

varchar

64

0

Y

N

表名:

5

page_title

varchar

255

0

Y

N

页面标题:

6

path

varchar

255

0

Y

N

路由路径:

7

position

varchar

32

0

Y

N

位置:

8

mode

varchar

32

0

N

N

_blank

跳转方式:

9

add

tinyint

3

0

N

N

1

是否可增加:

10

del

tinyint

3

0

N

N

1

是否可删除:

11

set

tinyint

3

0

N

N

1

是否可修改:

12

get

tinyint

3

0

N

N

1

是否可查看:

13

field_add

text

65535

0

Y

N

添加字段:

14

field_set

text

65535

0

Y

N

修改字段:

15

field_get

text

65535

0

Y

N

查询字段:

16

table_nav_name

varchar

500

0

Y

N

跨表导航名称:

17

table_nav

varchar

500

0

Y

N

跨表导航:

18

option

text

65535

0

Y

N

配置:

19

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

20

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

    1. 表collect (收藏)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

collect_id

int

10

0

N

Y

收藏ID:

2

user_id

int

10

0

N

N

0

收藏人ID:

3

source_table

varchar

255

0

Y

N

来源表:

4

source_field

varchar

255

0

Y

N

来源字段:

5

source_id

int

10

0

N

N

0

来源ID:

6

title

varchar

255

0

Y

N

标题:

7

img

varchar

255

0

Y

N

封面:

8

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

9

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

    1. 表comment (评论)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

comment_id

int

10

0

N

Y

评论ID:

2

user_id

int

10

0

N

N

0

评论人ID:

3

reply_to_id

int

10

0

N

N

0

回复评论ID:空为0

4

content

longtext

2147483647

0

Y

N

内容:

5

nickname

varchar

255

0

Y

N

昵称:

6

avatar

varchar

255

0

Y

N

头像地址:[0,255]

7

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

9

source_table

varchar

255

0

Y

N

来源表:

10

source_field

varchar

255

0

Y

N

来源字段:

11

source_id

int

10

0

N

N

0

来源ID:

    1. 表contact_us (联系我们)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

contact_us_id

int

10

0

N

Y

联系我们ID

2

theme

varchar

64

0

Y

N

主题

3

related_pictures

varchar

255

0

Y

N

相关图片

4

feedback_content

text

65535

0

Y

N

反馈内容

5

user

int

10

0

Y

N

0

用户

6

contact_number

varchar

64

0

Y

N

联系电话

7

examine_state

varchar

16

0

N

N

未审核

审核状态

8

examine_reply

varchar

16

0

Y

N

审核回复

9

recommend

int

10

0

N

N

0

智能推荐

10

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

11

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

    1. 表hits (用户点击)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

hits_id

int

10

0

N

Y

点赞ID:

2

user_id

int

10

0

N

N

0

点赞人:

3

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

4

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

    1. 表notice (公告)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

notice_id

mediumint

8

0

N

Y

公告id:

2

title

varchar

125

0

N

N

标题:

3

content

longtext

2147483647

0

Y

N

正文:

4

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

5

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

    1. 表praise (点赞)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

praise_id

int

10

0

N

Y

点赞ID:

2

user_id

int

10

0

N

N

0

点赞人:

3

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

4

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

8

status

bit

1

0

N

N

1

点赞状态:1为点赞,0已取消

    1. 表registered_users (注册用户)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

registered_users_id

int

10

0

N

Y

注册用户ID

2

gender

varchar

64

0

Y

N

性别

3

full_name

varchar

64

0

Y

N

姓名

4

examine_state

varchar

16

0

N

N

已通过

审核状态

5

recommend

int

10

0

N

N

0

智能推荐

6

user_id

int

10

0

N

N

0

用户ID

7

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

    1. 表slides (轮播图)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

slides_id

int

10

0

N

Y

轮播图ID:

2

title

varchar

64

0

Y

N

标题:

3

content

varchar

255

0

Y

N

内容:

4

url

varchar

255

0

Y

N

链接:

5

img

varchar

255

0

Y

N

轮播图:

6

hits

int

10

0

N

N

0

点击量:

7

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

    1. 表tv_drama_rating (电视剧评分)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

tv_drama_rating_id

int

10

0

N

Y

电视剧评分ID

2

name_of_tv_play

varchar

64

0

Y

N

电视剧名称

3

director

varchar

64

0

Y

N

导演

4

performer

varchar

64

0

Y

N

演员

5

user

int

10

0

Y

N

0

用户

6

fraction

varchar

64

0

Y

N

分数

7

evaluate

text

65535

0

Y

N

评价

8

recommend

int

10

0

N

N

0

智能推荐

9

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

10

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

    1. 表tv_play (电视剧)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

tv_play_id

int

10

0

N

Y

电视剧ID

2

name_of_tv_play

varchar

64

0

Y

N

电视剧名称

3

tv_series_category

varchar

64

0

Y

N

电视剧类别

4

cover

varchar

255

0

Y

N

封面

5

director

varchar

64

0

Y

N

导演

6

performer

varchar

64

0

Y

N

演员

7

set_number

varchar

64

0

Y

N

集数

8

view_link

varchar

255

0

Y

N

观看链接

9

score

varchar

64

0

Y

N

评分

10

region

varchar

64

0

Y

N

地区

11

tv_series_introduction

longtext

2147483647

0

Y

N

电视剧介绍

12

hits

int

10

0

N

N

0

点击数

13

praise_len

int

10

0

N

N

0

点赞数

14

recommend

int

10

0

N

N

0

智能推荐

15

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

16

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

    1. 表tv_series_classification (电视剧分类)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

tv_series_classification_id

int

10

0

N

Y

电视剧分类ID

2

tv_series_category

varchar

64

0

Y

N

电视剧类别

3

recommend

int

10

0

N

N

0

智能推荐

4

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

5

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

  1. 系统实现
    1. 登录模块的实现

该登录模块利用js进行设计,JavaScript函数CheckSubmit()对输入框是否为空进行验证,使用js的技术结合Mysql数据库的查询语句进行登录信息的验证。首先从文本框中分别获得账号user_name和密码user_pw,使用Sql语句“select * from t_user where user_name=‘”+user_name+“’ and user_pw=‘”+user_pw+“’”将查询结果赋给rs结果集,若mysql_query()返回值为空,表示数据库找不到该用户数据,若mysql_query()返回值不为空,则显示登录成功,进入主界面。

用户登录流程图如下所示。

 

5-1用户登录流程

用户登录流程:用户只有输入正确的用户名和密码才会成功进入系统,用户输入用户名密码后点击登录按钮,系统会进行校验该用户名是否存在,如果用户名与密码不匹配或者用户名不存在,则返回主界面。

系统登录界面如下图所示。

 

图5-2系统登录界面

    1. 用户子系统模块的实现
      1. 用户首页模块

在浏览器的地址栏里输入http://localhost:3306/index.Java 地址,就可以跳转到网剧推荐系统的首页,首页是由4个页面组成的,包括top、left、down和center等页面,这里也是浏览者访问系统的入口,通过@ include引入。

首页载入流程图如下所示。

 

5-3首页载入流程

首页载入流程:系统先连接数据库,显示界面参数初始化,读取数据库的数据表,读取html显示模板,对数据按添加时间排序,按照模板设计位置显示数据,刷新显示界面,断开数据库连接。

首页如下图所示。

 

图5-4首页界面

      1. 用户注册模块

系统的用户通过自行注册生成,在系统首页点击用户注册菜单,系统跳转到对应的注册页面。点击重置按钮,清空所填数据,点击注册按钮完成注册。

用户注册流程图如下所示。

 

5-5用户注册流程

注册个人信息实现流程为:填写个人信息,系统使用JQuery选择器获取在网页中输入的注册信息,再对联系方式、登录密码等信息进行验证,验证通过后用Ajax异步请求方式向服务器发送请求并把数据传送到后台,然后验证用户名是否已存在,如果已存在则注册失败提示“用户名已存在”;如果用户表中没有该用户名则把用户信息加入数据库,把操作状态以json字符串方式返回到前台。Ajax请求成功接收到返回的数据时会触发成功回调函数,然后解析返回的json字符串,系统根据返回信息弹出提示框,注册成功后返回登录页。

用户注册界面如下图所示。

 

图5-6用户注册界面

      1. 评论模块

用户给网剧添加评论,包括评分,评论人,评论内容等,在pinglunadd.Java实现评论的逻辑添加,管理员管理系统的所有评论信息,在pinglun_list.Java实现评论的管理。

评论流程图如下所示。

 

5-7信息评论流程

用户登录成功后,浏览网剧页面,输入评论语,添加该评论,修改评论,返回评论相关界面。

评论添加界面如下图所示。

 

图5-8评论添加界面

      1. 新闻资讯模块

用户选择相应的新闻资讯模块,通过id传参,找到id为此传参的新闻资讯,在zixunadd.Java浏览资讯内容。

图5-9新闻资讯界面

      1. 电视剧信息模块

管理员发布电视剧内容后,用户找到对应的电视剧信息,包括¥,选择相应的电视剧信息,通过id传参,找到该电视剧具体内容。

电视剧信息流程如下图所示。

图5-10电视剧信息流程

电视剧信息界面如下图所示。

 

图5-11电视剧信息界面

电视剧评论界面如下图所示

 

图5-12电视剧评论界面

    1. 管理员子系统模块的实现
      1. 系统用户管理模块

管理员对系统用户的管理,在yhzhgl.Java实现管理员用户的管理,包括录入、删除、修改,修改密码通过SESSION获取用户名,然后输入新密码,提交到mod.Java中,使用sql命令更新密码。

管理员用户管理的界面如下图所示。

 

图5-13管理员用户管理界面

      1. 电视剧信息管理模块

管理员在dianshijuxinxi_add.Java发布电视剧,跳转至电视剧添加表单,提交电视剧信息,包括编号、书名、类别、作者、封面等,信息提交后,数据库的电视剧信息表刷新数据,系统将电视剧列表展示出来。

电视剧信息管理的流程如所示。

 

图5-14电视剧信息管理流程

电视剧分类的界面如所示。

 

图5-15电视剧分类界面

电视剧信息管理的界面如所示。

 

图5-16电视剧信息管理界面

  1. 系统测试
    1. 测试目的

在这个产品被投入使用前,首先需要进行试用,这是重要的环节。考虑到某个部分的开发没有缺陷情况下,把各种模块拼接,也有一定概率就存在矛盾。这就好比每个人都很独特,但聚在一起就显得杂乱无章,需要保证有默契的配合。对于测试,要看它的各项内容是否契合的原则。若与最初定下的标准有一定程度上的出入,那么就需要做出一些调整,让最终的大方向朝着目标前进。

    1. 测试用例
      1. 登录测试 

登录测试用例如下表所示。

表6-1登录测试用例

输入

输出

用户名

密码

用户名和密码不能为空

Kkk

aaa

用户名长度不允许,请重新输入!

2109402315

123456

用户名出错,请重新输入!

sssss

123456

用户名出错,请重新输入!

      1. 注册测试 

注册测试用例如下表所示。

表6-2注册测试用例

输入

输出

用户名

密码

确认密码

邮箱

用户名和密码不能为空

Kkk

aaa

aaa

23@qq.com

注册成功

210

aaa

abc

23@qq.com

注册失败,两次密码不一致

sssss

aaa

aaa

注册成功

      1. 评论测试

评论测试用例如下表所示。

表6-3评论测试用例

功能

测试数据

预期结果

测试结果

添加评论

评论内容:asd

在评论列表中显示评论题目,点击显示评论内容。评论显示为未回答

在评论列表中显示评论题目,点击显示评论内容。评论显示为未回答

回复评论

回答评论:dxvcv。

评论列表中评论“asd”显示已回答,点击评论题目,显示评论内容和回答内容

评论列表中评论“asd”显示已回答,点击评论题目,显示评论内容和回答内容

删除评论

删除评论“asd”

评论成功删除

评论成功删除

      1. 网剧管理测试 

网剧测试用例如下表所示。

表6-4添加网剧测试用例

输入

输出

名称

类别

价格

备注

添加失败

网剧1

A

1

添加成功

A

1

添加失败,名称不能为空

网剧2

1

添加失败,请选择类别

      1. 电视剧分类测试 

电视剧分类测试用例如下表所示。

表6-5电视剧分类测试用例

输入

输出

名称

类别

数量

备注

添加失败

网剧1

A

1

添加成功

A

1

添加失败,名称不能为空

网剧2

1

添加失败,请选择类别

    1. 测试结果

经过测试,得到测试结果如下表所示。

表6-6测试结果

序号

测试项目

内容和目的

测试结果

用户登录

输入正确用户名与密码

可以登录

输入错误用户名与密码

提示错误的信息

电视剧资讯管理

(添加,修改,删除)

输入正确信息

成功完成

输入错误信息

操作失败

修改登录密码

修改新的密码

成功完成

用户管理

(添加,修改,删除)

输入正确信息

成功完成

输入错误信息

操作失败

评论管理

(添加,修改,删除)

输入正确信息

成功完成

输入错误信息

操作失败

电视剧分类管理

(添加,修改,删除)

输入正确信息

成功完成

输入错误信息

操作失败

电视剧信息管理

(添加,修改,删除)

输入正确信息

成功完成

输入错误信息

操作失败

  1. 总结与展望

本次毕业论文的主要是利用Hadoop+Mysql开发一个安全可靠,操作简易,同时具备业务可扩展的网剧推荐系统。本文详细的论述了网剧推荐系统的设计和开发,本系统的所有事务逻辑都是按照系统的需求分析进行设计的,系统有普通用户和系统管理员两种角色,本系统多处采用了AJAX的异步交互技术,同时它也叫异步交互技术,利用它我们可以让网页的局部进行数据刷新操作,AJAX和传统的数据更新技术大大增加了客户的体验程度,由于是对局部进行操作那么就减少了一些繁琐而又不必要的操作,减轻了服务器对页面解析的负担。

与其他系统相比,本系统有自身的优点,

例如:

(1)创新性强;

(2)业务逻辑性强,安全性高,在一些重要的功能模块需要通过审查之后才可使用;

(3)移植性高,在所有window平台都可使用。

当然也还有很多需要进一步改进的地方:

(1)系统大多数页面都是全局刷新,缺乏局部刷新,这将增加服务器的压力,如果有大量用户在同一时间段操作同一个功能模块,可能会导致查询缓慢;

(2)页面没有经过专业的UI设计,美观程度不及其他市场其他网站系统,有待改善。

参考文献

[1] 匡俊,唐卫红,陈雷慧,等.基于特征工程的视频点击率预测算法 [J].華东师范大学学报(自然科学版),2018(3):77-87.

[2] David Goldberg,David Nichols,Brian M. Oki,et al. Using collaborative filtering to weave an information tapestry [J]. Communications of the ACM,1992,35(12):61-70.

[3] Deshpande M,KarypisG.Item-based top- N,recommendation algorithms [M].ACM,2004.

[4] 李姗姗.基于协同过滤的视频推荐系统设计 [D].南京:南京邮电大学,2017.

[5] 苏梦珂,杨煜普.基于信息熵和用户行为一致性的协同过滤分组推荐 [J/OL].计算机应用研究:1-6.http://kns.cnki.net/kcms/detail/51.1196.TP.20181009.1405.010.html,2018-10-26.

[6] 高睿.基于深度神经网络的视频个性化推荐系统研究 [D].深圳:深圳大学,2017.

[7] 李同欢,唐雁,刘冰.基于深度学习的多交互混合推荐模型 [J/OL].计算机工程与应用:1-9.http://kns.cnki.net/kcms/detail/11.2127.TP.20180913.0636.010.html,2018-10-26.

[8] 黄立威,江碧涛,吕守业,等.基于深度学习的推荐系统研究综述 [J].计算机学报,2018,41(7):1619-1647.

[9] Gediminas Adomavicius,Ramesh Sankaranarayanan,Shahana Sen,et al. Incorporating contextual information in recommender systems using a multidimensional approach [J]. ACM TranSactions on Information Systems,2005,23(1):103-145.

[10] 汤伟.基于Web挖掘的个性化视频推荐系统设计与实现 [J].电子设计工程,2018,26(18):102-106+112.

[11] 韩皎.基于分布式平台的个性化推荐算法研究 [D].西安:长安大学,2017.

[12] 翁小兰,王志坚.协同过滤推荐算法研究进展 [J].计算机工程与应用,2018,54(1):25-31.

[13] Xu H,Ye G,Li Y,et al. Large Video Event Ontology Browsing,Search and Tagging (EventNet Demo) [C]// ACM International Conference on Multimedia. ACM,2015:803-804.

[14] 夏冬晨.基于YouTube的视频社会关注度提高方法的研究 [D].杭州:杭州电子科技大学,2017.

[15] Netflix官网.https://lunhem.com/s.php?t=Netflix.

致谢

经过几个月时间的努力终于完成了这篇文章,在文章的写作与研究的过程中遇到了很多困难,都在同学和老师的帮助下解决了。尤其非常感谢我最敬爱的老师,他对我进行了无私的指导和帮助,不厌其烦的帮助进行文章的修改。老师严谨的治学态度、渊博的学术知识、诲人不倦的敬业精神以及宽容的待人风范使我获益颇丰。此外,在校电视剧馆查找资料的时候,电视剧馆的老师也给我提供了很多方面的支持与帮助。在此,向帮助和指导过我的老师表示最衷心的感谢!感谢这篇文章所涉及到的各位学者。本文引用了数位学者的文献,如果没有各位学者的研究成果的帮助和启发,我将很难完成本篇文章的写作。感谢我的同学、朋友以及所在单位的同事,在我写文章的过程中给与了我很多素材和帮助,还在文章的撰写和排版过程中提供热情的帮助。同时,感谢我的室友对我的热心指导和帮助,经常有不懂之处都是大家在帮助我,才使得我比较顺利的完成了这篇文章。由于我水平有限,所写文章难免有不足之处,恳请各位老师和学友批评和指正!

                            免费领取源码,请点赞关注私信博主

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值