基于数据挖掘的旅游推荐系统的设计与实现----附源码89302 爬虫


摘 要

   本文介绍了一种基于数据挖掘的旅游推荐系统的设计与实现。该系统通过爬虫技术从互联网上抓取旅游相关的数据,并运用数据挖掘技术对这些数据进行处理和分析,以提取出有价值的信息。然后,利用Flask框架构建一个Web应用程序,将这些信息以直观、友好的方式呈现给用户,并根据用户的偏好和行为推荐适合他们的旅游目的地和行程。本文详细阐述了系统的架构设计、功能模块划分、数据处理流程以及推荐算法的实现过程。通过实际运行和测试,验证了该系统的可行性和有效性,为旅游者提供了个性化、智能化的旅游推荐服务,对于提升旅游体验、促进旅游业的发展具有重要意义。

关键词:旅游推荐系统;数据挖掘;Flask;爬虫;个性化推荐

Abstract

This article introduces the design and implementation of a tourism recommendation system based on data mining. The system uses crawler technology to capture tourism related data from the Internet, and uses data mining technology to process and analyze these data to extract valuable information. Then, using the Flask framework, build a web application that presents this information to users in an intuitive and user-friendly manner, and recommends suitable tourist destinations and itineraries based on their preferences and behaviors. This article provides a detailed explanation of the system's architecture design, functional module division, data processing flow, and implementation process of recommendation algorithms. Through practical operation and testing, the feasibility and effectiveness of the system have been verified, providing personalized and intelligent tourism recommendation services for tourists, which is of great significance for improving tourism experience and promoting the development of the tourism industry.

Keywords: Tourism recommendation system; Data mining; Flask; Reptiles; Personalized recommendations

目录

第1章 引言

1.1 研究背景与意义

1.2 国内外研究现状

第2章 系统开发环境

2.1 Pycharm简介

2.2 MySQL描述

2.3 Python爬虫技术

2.4 Flask框架介绍

第3章 系统分析

3.1 可行性分析

3.1.1 技术可行性

3.1.2 经济可行性

3.1.3 社会可行性

3.1.4 法律可行性

3.2 功能需求分析

3.3 性能需求分析

3.4 系统用例分析

第4章 系统设计

4.1 系统体系结构

4.2 总体结构设计

4.3 数据库设计

4.3.1 概念设计

4.3.2 逻辑设计

第5章 系统实现

5.1 登录模块的实现

5.2 普通用户功能模块的实现

5.2.1 注册模块的实现

5.2.2 前台首页模块的实现

5.2.3 景点推荐模块的实现

5.2.4 旅游资讯模块的实现

5.2.5 用户留言模块的实现

5.3 管理员功能模块的实现

5.3.1 用户管理模块的实现

5.3.2 系统首页模块的实现

5.3.3 景点推荐管理模块的实现

5.3.4 爬虫数据管理模块的实现

5.3.5 旅游公告管理模块的实现

5.3.6 资源管理模块的实现

5.3.7 系统管理模块的实现

第6章 系统测试

6.1 测试目标

6.2 功能测试

6.3 测试结果

第7章 总结与展望

参考文献

致谢

第一章  引言

1.1 研究背景与意义

随着互联网的快速发展和旅游业的蓬勃兴起,旅游信息的获取和推荐成为了一个热门的研究领域。传统的旅游推荐方法往往依赖于人工编辑和用户主动搜索,不仅效率低下,而且难以满足用户个性化的需求。因此,开发一种能够自动抓取和分析旅游数据,并根据用户偏好提供智能推荐的系统显得尤为重要。

在这样的背景下,基于数据挖掘的旅游推荐系统的设计与实现应运而生。该系统通过爬虫技术从互联网上自动抓取旅游相关的数据,包括景点信息、用户评价、旅游攻略等。然后,运用数据挖掘技术对抓取到的数据进行处理和分析,提取出有价值的信息,如景点的热度、用户的喜好等。这些信息为后续的推荐算法提供了数据支持。

系统能够根据用户的偏好和行为,为他们推荐适合他们的旅游目的地和行程,提升旅游体验。通过自动化抓取和分析数据,减少了人工编辑和用户主动搜索的工作量,提高了信息获取的效率。同时,该系统有助于用户更好地了解和选择旅游目的地,从而推动旅游业的发展。

综上所述,基于数据挖掘的旅游推荐系统的设计与实现具有重要的研究背景和意义,不仅满足了用户个性化的需求,也推动了旅游业的发展。

1.2 国内外研究现状

国内研究现状:

在国内,随着大数据技术的不断发展和普及,旅游推荐系统成为了一个备受关注的研究领域。许多学者和企业开始探索基于数据挖掘的旅游推荐系统。其中,一些研究团队利用数据挖掘技术分析用户行为、兴趣偏好和旅游目的地特征,从而为用户提供个性化的旅游推荐服务。同时,随着爬虫技术的不断成熟,越来越多的系统开始利用爬虫从互联网上抓取旅游相关的数据,以丰富推荐内容。然而,目前国内的旅游推荐系统在智能化、精准度和用户体验方面仍有待提升。

国外研究现状:

在国外,旅游推荐系统的研究起步较早,已经取得了一定的成果。许多国际知名企业和研究机构在旅游推荐领域进行了深入研究。他们利用先进的数据挖掘技术和机器学习算法,对旅游数据进行深度分析,为用户提供更加精准和个性化的推荐服务。此外,国外的旅游推荐系统还注重与社交媒体的结合,通过用户社交行为和评价信息来优化推荐结果。这些系统不仅具有高度的智能化和精准度,还注重用户体验和界面设计,为用户提供了更加便捷和舒适的旅游推荐体验。

综上所述,国内外在基于数据挖掘、Flask框架和爬虫的旅游推荐系统的设计与实现方面都已经取得了一定的进展。然而,仍然存在一些挑战和问题,如数据质量、算法优化和用户体验等,需要进一步的研究和改进。通过不断的技术创新和实践探索,相信未来的旅游推荐系统会更加智能、精准和个性化,为旅游者提供更加优质的旅游体验。

  

第二章  系统开发环境

2.1 Pycharm简介

PyCharm是用于Python脚本语言的最流行的IDE。

1.每个文件都有其输出窗口。

2.可以终止进程(只要点下按钮就行)。

3.各种提示超强:①没用的变量颜色会变灰②用错了的变量下面会有红色波浪线③书写提示(sublime也有但较弱)。

4.索引功能超强。

2.2 MySQL描述

现在MySQL数据库在网络上它可以支撑许多个用户,而且也可以适应客服机和服务器的部署或者配置等,我们这里的服务器和客户机其实就是一种软件上的概念,并且我们使用的计算机硬件也与他们不存在一一对应的关系。

MySQL是一款非常流行的关系型数据库管理系统,它的出现一直都是佼佼者,它不仅功能非常强大,而且使用起来非常方便,并且MySQL的跨平台能力也很好,软件开发人员非常喜欢它的这些强大的优点。不同于其他关系型数据库,对于数据库的管理它有着自己的一套方案,通过对用户设定相应的权限和角色来达到对数据库的管理。由此可见,MySQL是一个能够适用于吞吐量高,可靠性高,效率高的一款数据库管理软件。

优点一:MySQL中对于不同身份的用户都设定其不同的权限来完成不同的业务逻辑,这使得MySQL在安全和完整性远远超出了其他关系型数据库。

优点二:对于那些动画、图形和声音的数据类型MySQL也可以支持,这说明多数据类型MySQL也是可以支持的。

优点三:MySQL还可以做到多个平台的开发,软件开发的多种编程语言都可以实现对MySQL数据库的操作。

2.3 Python爬虫技术

爬虫,即网络爬虫,是通过递归访问网络资源,抓取网络中信息的技术。

网络为搜索引擎从万维网下载网页。一般分为传统爬虫和聚焦爬虫。

传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。通俗的讲,也就是通过源码解析来获得想要的内容。

聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到达到系统的某一条件时停止。另外,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;对于聚焦爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导

2.4 Flask框架介绍

Flask是一个轻量级的可定制框架,使用Python语言编写,较其他同类型框架更为灵活、轻便、安全且容易上手。它可以很好地结合MVC模式进行开发,开发人员分工合作,小型团队在短时间内就可以完成功能丰富的中小型网站或Web服务的实现。另外,Flask还有很强的定制性,用户可以根据自己的需求来添加相应的功能,在保持核心功能简单的同时实现功能的丰富与扩展,其强大的插件库可以让用户实现个性化的网站定制,开发出功能强大的网站。

Flask是目前十分流行的web框架,采用Python编程语言来实现相关功能。它被称为微框架(microframework),“微”并不是意味着把整个Web应用放入到一个Python文件,微框架中的“微”是指Flask旨在保持代码简洁且易于扩展,Flask框架的主要特征是核心构成比较简单,但具有很强的扩展性和兼容性,程序员可以使用Python语言快速实现一个网站或Web服务。一般情况下,它不会指定数据库和模板引擎等对象,用户可以根据需要自己选择各种数据库。Flask自身不会提供表单验证功能,在项目实施过程中可以自由配置,从而为应用程序开发提供数据库抽象层基础组件,支持进行表单数据合法性验证、文件上传处理、用户身份认证和数据库集成等功能。Flask主要包括Werkzeug和Jinja2两个核心函数库,它们分别负责业务处理和安全方面的功能,这些基础函数为web项目开发过程提供了丰富的基础组件。Werkzeug库十分强大,功能比较完善,支持URL路由请求集成,一次可以响应多个用户的访问请求;支持Cookie和会话管理,通过身份缓存数据建立长久连接关系,并提高用户访问速度;支持交互式Javascript调试,提高用户体验;可以处理HTTP基本事务,快速响应客户端推送过来的访问请求。Jinja2库支持自动HTML转移功能,能够很好控制外部黑客的脚本攻击。系统运行速度很快,页面加载过程会将源码进行编译形成Python字节码,从而实现模板的高效运行;模板继承机制可以对模板内容进行修改和维护,为不同需求的用户提供相应的模板。目前Python的web框架有很多。除了Flask,还有Flask、Web2py等等。其中Flask是目前Python的框架中使用度最高的。但是Flask如同java的EJB(EnterpriseJavaBeansJavaEE服务器端组件模型)多被用于大型网站的开发,但对于大多数的小型网站的开发,使用SSH(Struts+Spring+Hibernat的一个JavaEE集成框架)就可以满足,和其他的轻量级框架相比较,Flask框架有很好的扩展性,这是其他Web框架不可替代的。

第三章  系统分析

3.1 可行性分析

开发任何一个系统,都要对其可行性进行分析,对其时间和资源上的限制进行考虑,这样可以减少系统开发的风险。同时,分析之后不仅能够合理的运用人力,还能在各方面资源的消耗上得到节省。下面就对技术、经济和社会三个方面来介绍。

3.1.1 技术可行性

首先,从技术角度来看,基于数据挖掘的旅游推荐系统的设计与实现是完全可行的。数据挖掘技术已经相当成熟,能够有效处理和分析大量数据,提取出有价值的信息。Flask是一个轻量级、易于扩展的Web框架,适合构建小型到中型的应用程序,为旅游推荐系统提供稳定的后端支持。爬虫技术则能够自动抓取互联网上的旅游相关数据,为系统提供丰富的数据源。

3.1.2经济可行性

经济方面,该系统的实现成本相对较低。Flask框架是开源的,可以免费使用;数据挖掘和爬虫技术所需的硬件和软件资源也相对便宜,不需要高昂的投资。此外,系统的运行和维护成本也相对较低,可以为企业节省大量成本。

3.1.3 社会可行性

从社会角度来看,旅游推荐系统的需求日益增长。随着人们生活水平的提高和旅游业的快速发展,越来越多的人选择出游。一个智能、个性化的旅游推荐系统能够满足人们的多样化需求,提升旅游体验,因此具有很高的社会价值。

3.1.4 法律可行性

在法律方面,该系统的设计与实现需要遵守相关的法律法规,如数据保护法、网络安全法等。只要确保在数据采集、存储和使用过程中遵守相关法律法规,该系统的法律可行性是能够得到保障的。

综上所述,基于数据挖掘、Flask框架和爬虫的旅游推荐系统的设计与实现在技术、经济、社会和法律方面都是可行的。该系统有望为旅游者提供智能、个性化的旅游推荐服务,提升旅游体验,促进旅游业的发展。

3.2 功能需求分析

基于数据挖掘的旅游推荐系统针对普通用户和管理员进行了详细的功能需求分析,以确保系统的实用性和易用性。以下是针对普通用户和管理员的具体功能需求:

1. 普通用户功能:

登录注册: 提供用户注册新账户和登录系统的功能。

首页: 展示系统的主要功能入口和最新信息,包括旅游公告、旅游资讯等。

旅游公告: 展示系统发布的重要通知和公告信息,包括旅游活动、优惠信息等。

旅游资讯: 提供用户浏览各种旅游相关的资讯,包括目的地介绍、旅游攻略等。

用户留言: 用户可以在系统中留言、提出建议或者互相交流。

景点推荐: 系统根据用户的兴趣和喜好,推荐适合的旅游景点。

我的账户: 提供用户个人账户管理,包括个人信息、收藏的景点等。

个人中心:

个人首页: 展示用户个人信息和相关统计数据。

收藏: 用户可以收藏感兴趣的旅游景点或资讯。

2. 管理员功能:

后台首页: 提供管理员登录后的管理主页,展示系统的重要信息和功能入口。

系统用户: 管理注册用户的信息,包括普通用户和管理员的信息。

爬虫数据管理: 管理爬虫获取的旅游相关数据,包括数据的更新、删除等操作。

景点分类管理: 管理旅游景点的分类信息,确保用户能够方便地浏览和获取信息。

地区信息管理: 管理旅游地区的信息,包括添加、编辑和删除地区信息。

景点推荐管理: 管理系统根据数据挖掘推荐的景点信息,包括审核、统计等操作。

星级数据管理: 管理旅游景点的星级评定数据,包括评定、修改等操作。

系统管理:

轮播图管理: 管理系统首页的轮播图信息,提供系统宣传和通知功能。

留言管理: 管理用户在系统中的留言信息,包括审核、删除等操作。

旅游公告管理: 管理系统发布的旅游活动旅游公告信息,包括添加、编辑和删除旅游公告等操作。

资源管理:

旅游资讯: 管理平台发布的旅游资讯内容,包括添加、编辑和删除资讯信息。

资讯分类: 管理旅游资讯的分类信息,确保用户能够方便地浏览和获取信息。

以上是基于数据挖掘的旅游推荐系统的功能需求分析,涵盖了普通用户和管理员两个角色的功能设计与实现要求。

3.3.能需求分析

评判一个系统好坏的一项重要指标就是性能,下面是对此系统的一些性能进行阐述。

1.系统的安全性和稳定性: 基于数据挖掘的旅游推荐系统在管理权限上有着严格的控制,即想登录此平台进行操作,则必须要有操作权限,没有权限的用户是不可能登录平台查看任何的信息和数据,从而确保了系统的安全性。

2.数据的完整性和准确性:第一个是各项记录信息的完整性,信息记录的内容可以为空;第二个是各项信息数据之间相互联系的准确性;第三个是数据在不同记录信息的一致性

3.用户操作系统简单方便:在系统开发中按照“简单易用”的原则,能够使用户对系统的使用一目了然,既能保证用户使用,同时又能保证维护人员方便维护。

3.4 系统用例分析

系统的用例展示的是系统功能与用户之间的关系,通过用例的方式能够直观的展示出来,本基于数据挖掘的旅游推荐系统的完整UML用例图如下所示。

普通用户用例图如下所示。

图3-1 普通用户用例图

管理员用例图如下所示。

图3-2 管理员用例图

第四章  系统设计

4.1 系统体系结构

基于数据挖掘的旅游推荐系统选择B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式。适合在互联网上进行操作,只要用户能连网,任何时间、任何地点都可以进行系统的操作使用。系统工作原理图如图4-1所示:

图3-1 系统工作原理图

4.2 总体结构设计

根据对系统的功能的分析,可以总结基于数据挖掘的旅游推荐系统的具体功能模块包括下面的几个主要的功能模块:该系统主要从两大模块进行设计的,首先就是用户参与操作需要的模块,此外还需要有管理员用到的模块,两者之间不是互相独立的,他们之间有着密切的联系,同数据库表中的数据连接起来进行操作。每个模块访问相同的数据库,但访问的表不同。系统的各个功能模块是根据所收集的资料研究得到的。在以上分析功能的基础上,系统模块分为多个模块。普通用户含有的功能有登录注册、首页、旅游公告、旅游资讯、用户留言、景点推荐、我的账户、个人中心(个人首页、收藏)等功能,管理员含有的功能有后台首页、系统用户、爬虫数据管理、景点分类管理、地区信息管理、景点推荐管理、星级数据管理、系统管理(轮播图管理)、留言管理、旅游公告管理、资源管理(旅游资讯、资讯分类)等功能。

系统的功能结构图如下图所示。

图3-2系统功能结构图

4.3 数据库设计

4.3.1 概念设计

E-R图一般是由实体、实体的属性与联系三个要素组成的。在规划系统中所使用的数据库实体对象及实体E-R图,则需要通过对系统的需求分析、业务流程设计和系统功能结构来确定的。

总体ER图如下图所示。

图4-3总体ER图

4.3.2 逻辑设计

将实体属性模型转换为关系数据库应该遵循以下几个原则:

1.一个实体转换后要对应一个关系。

2.所有的主键必须要定义为非空(not null)。

3.针对二元联系也应该按照一对多、弱对实、一对一和多对多等联系来定义外键。

得到数据库的关系后,设计如下表结构。

表access_token (登陆访问时长)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

token_id

int

10

0

N

Y

临时访问牌ID

2

token

varchar

64

0

Y

N

临时访问牌

3

info

text

65535

0

Y

N

4

maxage

int

10

0

N

N

2

最大寿命:默认2小时

5

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

6

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

7

user_id

int

10

0

N

N

0

用户编号:

表article (文章:用于内容管理系统的文章)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

article_id

mediumint

8

0

N

Y

文章id:[0,8388607]

2

title

varchar

125

0

N

Y

标题:[0,125]用于文章和html的title标签中

3

type

varchar

64

0

N

N

0

文章分类:[0,1000]用来搜索指定类型的文章

4

hits

int

10

0

N

N

0

点击数:[0,1000000000]访问这篇文章的人次

5

praise_len

int

10

0

N

N

0

点赞数

6

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

7

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

8

source

varchar

255

0

Y

N

来源:[0,255]文章的出处

9

url

varchar

255

0

Y

N

来源地址:[0,255]用于跳转到发布该文章的网站

10

tag

varchar

255

0

Y

N

标签:[0,255]用于标注文章所属相关内容,多个标签用空格隔开

11

content

longtext

2147483647

0

Y

N

正文:文章的主体内容

12

img

varchar

255

0

Y

N

封面图

13

description

text

65535

0

Y

N

文章描述

表article_type (文章分类)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

type_id

smallint

5

0

N

Y

分类ID:[0,10000]

2

display

smallint

5

0

N

N

100

显示顺序:[0,1000]决定分类显示的先后顺序

3

name

varchar

16

0

N

N

分类名称:[2,16]

4

father_id

smallint

5

0

N

N

0

上级分类ID:[0,32767]

5

description

varchar

255

0

Y

N

描述:[0,255]描述该分类的作用

6

icon

text

65535

0

Y

N

分类图标:

7

url

varchar

255

0

Y

N

外链地址:[0,255]如果该分类是跳转到其他网站的情况下,就在该URL上设置

8

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

9

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表auth (用户权限管理)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

auth_id

int

10

0

N

Y

授权ID:

2

user_group

varchar

64

0

Y

N

用户组:

3

mod_name

varchar

64

0

Y

N

模块名:

4

table_name

varchar

64

0

Y

N

表名:

5

page_title

varchar

255

0

Y

N

页面标题:

6

path

varchar

255

0

Y

N

路由路径:

7

position

varchar

32

0

Y

N

位置:

8

mode

varchar

32

0

N

N

_blank

跳转方式:

9

add

tinyint

3

0

N

N

1

是否可增加:

10

del

tinyint

3

0

N

N

1

是否可删除:

11

set

tinyint

3

0

N

N

1

是否可修改:

12

get

tinyint

3

0

N

N

1

是否可查看:

13

field_add

text

65535

0

Y

N

添加字段:

14

field_set

text

65535

0

Y

N

修改字段:

15

field_get

text

65535

0

Y

N

查询字段:

16

table_nav_name

varchar

500

0

Y

N

跨表导航名称:

17

table_nav

varchar

500

0

Y

N

跨表导航:

18

option

text

65535

0

Y

N

配置:

19

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

20

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表classification_of_tourist_attractions (景点分类)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

classification_of_tourist_attractions_id

int

10

0

N

Y

景点分类ID

2

classification_of_tourist_attractions

varchar

64

0

Y

N

景点分类

3

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

4

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表collect (收藏)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

collect_id

int

10

0

N

Y

收藏ID:

2

user_id

int

10

0

N

N

0

收藏人ID:

3

source_table

varchar

255

0

Y

N

来源表:

4

source_field

varchar

255

0

Y

N

来源字段:

5

source_id

int

10

0

N

N

0

来源ID:

6

title

varchar

255

0

Y

N

标题:

7

img

varchar

255

0

Y

N

封面:

8

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

9

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表comment (评论)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

comment_id

int

10

0

N

Y

评论ID:

2

user_id

int

10

0

N

N

0

评论人ID:

3

reply_to_id

int

10

0

N

N

0

回复评论ID:空为0

4

content

longtext

2147483647

0

Y

N

内容:

5

nickname

varchar

255

0

Y

N

昵称:

6

avatar

varchar

255

0

Y

N

头像地址:[0,255]

7

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

9

source_table

varchar

255

0

Y

N

来源表:

10

source_field

varchar

255

0

Y

N

来源字段:

11

source_id

int

10

0

N

N

0

来源ID:

表crawler_data (爬虫数据)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

crawler_data_id

int

10

0

N

Y

爬虫数据ID

2

attraction_name

varchar

64

0

Y

N

景点名称

3

strategy_quantity

varchar

64

0

Y

N

攻略数量

4

scenic_spot_rating

varchar

64

0

Y

N

景点评分

5

introduction_to_scenic_spots

varchar

64

0

Y

N

景点简介

6

scenic_spot_ranking

varchar

64

0

Y

N

景点排名

7

longitude_of_tourist_attractions

varchar

64

0

Y

N

景点经度

8

attraction_latitude

varchar

64

0

Y

N

景点纬度

9

number_of_comments

varchar

64

0

Y

N

点评数量

10

number_of_hikers

varchar

64

0

Y

N

驴友数量

11

details_link

varchar

255

0

Y

N

详情链接

12

overview_of_scenic_spots

text

65535

0

Y

N

景点概述

13

attraction_address

varchar

64

0

Y

N

景点地址

14

opening_hours

text

65535

0

Y

N

开放时间

15

ticket_information

text

65535

0

Y

N

门票信息

16

transportation_guidelines

text

65535

0

Y

N

交通指南

17

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

18

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表hits (用户点击)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

hits_id

int

10

0

N

Y

点赞ID:

2

user_id

int

10

0

N

N

0

点赞人:

3

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

4

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

表message (留言板)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

message_id

int

10

0

N

Y

留言板ID:

2

user_id

int

10

0

N

N

0

用户ID:

3

title

varchar

64

0

Y

N

标题:

4

content

longtext

2147483647

0

N

N

内容:

5

nickname

varchar

32

0

N

N

昵称:

6

avatar

varchar

255

0

Y

N

头像:

7

email

varchar

125

0

Y

N

留言者邮箱

8

phone

varchar

11

0

Y

N

留言者手机号码

9

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

10

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

11

reply

longtext

2147483647

0

Y

N

回复

12

reply_state

tinyint

4

0

Y

N

0

回复状态

表notice (公告)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

notice_id

mediumint

8

0

N

Y

公告id:

2

title

varchar

125

0

N

N

标题:

3

content

longtext

2147483647

0

Y

N

正文:

4

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

5

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表praise (点赞)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

praise_id

int

10

0

N

Y

点赞ID:

2

user_id

int

10

0

N

N

0

点赞人:

3

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

4

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

8

status

bit

1

0

N

N

1

点赞状态:1为点赞,0已取消

表recommended_tourist_attractions (景点推荐)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

recommended_tourist_attractions_id

int

10

0

N

Y

景点推荐ID

2

classification_of_tourist_attractions

varchar

64

0

Y

N

景点分类

3

attraction_name

varchar

64

0

Y

N

景点名称

4

tourist_attraction_star_rating

varchar

64

0

Y

N

景点星级

5

scenic_area

varchar

64

0

Y

N

景点地区

6

scenic_spot_pictures

varchar

255

0

Y

N

景点图片

7

admission_price

int

10

0

Y

N

0

门票价格

8

tourism_strategy

text

65535

0

Y

N

旅游攻略

9

recommended_route

text

65535

0

Y

N

推荐路线

10

introduction_to_scenic_spots

text

65535

0

Y

N

景点介绍

11

hits

int

10

0

N

N

0

点击数

12

praise_len

int

10

0

N

N

0

点赞数

13

recommend

int

10

0

N

N

0

智能推荐

14

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

15

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表regional_information (地区信息)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

regional_information_id

int

10

0

N

Y

地区信息ID

2

regional_information

varchar

64

0

Y

N

地区信息

3

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

4

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表regular_users (普通用户)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

regular_users_id

int

10

0

N

Y

普通用户ID

2

user_name

varchar

64

0

Y

N

用户姓名

3

user_phone_number

varchar

16

0

Y

N

用户电话

4

user_gender

varchar

64

0

Y

N

用户性别

5

examine_state

varchar

16

0

N

N

已通过

审核状态

6

user_id

int

10

0

N

N

0

用户ID

7

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表slides (轮播图)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

slides_id

int

10

0

N

Y

轮播图ID:

2

title

varchar

64

0

Y

N

标题:

3

content

varchar

255

0

Y

N

内容:

4

url

varchar

255

0

Y

N

链接:

5

img

varchar

255

0

Y

N

轮播图:

6

hits

int

10

0

N

N

0

点击量:

7

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表star_rating_data (星级数据)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

star_rating_data_id

int

10

0

N

Y

星级数据ID

2

classification_of_tourist_attractions

varchar

64

0

Y

N

景点分类

3

attraction_name

varchar

64

0

Y

N

景点名称

4

tourist_attraction_star_rating

varchar

64

0

Y

N

景点星级

5

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

6

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表upload (文件上传)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

upload_id

int

10

0

N

Y

上传ID

2

name

varchar

64

0

Y

N

文件名

3

path

varchar

255

0

Y

N

访问路径

4

file

varchar

255

0

Y

N

文件路径

5

display

varchar

255

0

Y

N

显示顺序

6

father_id

int

10

0

Y

N

0

父级ID

7

dir

varchar

255

0

Y

N

文件夹

8

type

varchar

32

0

Y

N

文件类型

表user (用户账户:用于保存用户登录信息)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

user_id

mediumint

8

0

N

Y

用户ID:[0,8388607]用户获取其他与用户相关的数据

2

state

smallint

5

0

N

N

1

账户状态:[0,10](1可用|2异常|3已冻结|4已注销)

3

user_group

varchar

32

0

Y

N

所在用户组:[0,32767]决定用户身份和权限

4

login_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

上次登录时间:

5

phone

varchar

11

0

Y

N

手机号码:[0,11]用户的手机号码,用于找回密码时或登录时

6

phone_state

smallint

5

0

N

N

0

手机认证:[0,1](0未认证|1审核中|2已认证)

7

username

varchar

16

0

N

N

用户名:[0,16]用户登录时所用的账户名称

8

nickname

varchar

16

0

Y

N

昵称:[0,16]

9

password

varchar

64

0

N

N

密码:[0,32]用户登录所需的密码,由6-16位数字或英文组成

10

email

varchar

64

0

Y

N

邮箱:[0,64]用户的邮箱,用于找回密码时或登录时

11

email_state

smallint

5

0

N

N

0

邮箱认证:[0,1](0未认证|1审核中|2已认证)

12

avatar

varchar

255

0

Y

N

头像地址:[0,255]

13

open_id

varchar

255

0

Y

N

针对获取用户信息字段

14

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

15

vip_level

varchar

255

0

Y

N

会员等级

16

vip_discount

double

11

2

Y

N

0.00

会员折扣

表user_group (用户组:用于用户前端身份和鉴权)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

group_id

mediumint

8

0

N

Y

用户组ID:[0,8388607]

2

display

smallint

5

0

N

N

100

显示顺序:[0,1000]

3

name

varchar

16

0

N

N

名称:[0,16]

4

description

varchar

255

0

Y

N

描述:[0,255]描述该用户组的特点或权限范围

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

8

register

smallint

5

0

Y

N

0

注册位置:

9

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

10

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

第五章  系统实现

5.1 登录模块的实现

为确保系统安全性,系统操作员只有在登录界面输入正确的用户名、密码、权限以及验证码,单击“登录”按钮后才能够进入本系统的主界面。

用户登录流程图如下所示。

图5-1用户登录流程图

登录界面如下图所示。

图5-2登录界面

5.2 普通用户功能模块的实现

5.2.1 注册模块的实现

用户输入用户名、密码、电话、姓名等必填信息后,点击注册按钮完成用户的注册。

用户注册流程图如下所示。

图5-3用户注册流程图

用户注册界面如下图所示。

图5-4用户注册界面

5.2.2 前台首页模块的实现

当进入基于数据挖掘的旅游推荐系统的时候,首先映入眼帘的是系统的导航栏、旅游公告以及轮播图等,右上角是用户登录以及注册按钮,其主界面展示如下图5-5所示。

图5-5前台首页界面

5.2.3 景点推荐模块的实现

当用户点击基于数据挖掘的旅游推荐系统中导航栏上的“景点推荐”后将会进入到该“景点推荐”列表的界面,用户可以查看系统推荐的旅游景点推荐信息,包括图片、描述等,可以点赞、收藏等,界面如下图所示。

图5-6景点推荐界面

5.2.4 旅游资讯模块的实现

当用户点击“旅游资讯”这一菜单按钮,可以查看旅游资讯的详情信息,可以进行点赞、收藏、评论等。界面如下图所示。

图5-7旅游资讯详情界面

5.2.5用户留言模块的实现

当用户点击“用户留言”这一菜单按钮,用户可以在系统中留言、提出建议或者互相交流。界面如下图5-8所示。

图5-8用户留言界面图

5.3 管理员功能模块的实现

5.3.1 用户管理模块的实现

系统用户管理主要是对新用户的添加和旧用户的删除。新用户的添加主要是指添加用户名称并确定其密码;旧用户的删除也是从下拉菜单中找到对应的用户名称将其删除。不论是新用户添加还是旧用户的删除,这个权限只有管理员具有。

用户管理流程图如下所示。

图5-9用户管理流程图

用户管理界面如下图所示。

图5-10普通用户管理界面

5.3.3 系统首页模块的实现

系统首页,管理员登录后台系统后,可以管理后台首页、系统用户、爬虫数据管理、景点分类管理、地区信息管理、景点推荐管理、星级数据管理、系统管理(轮播图管理)、留言管理、旅游公告管理、资源管理(旅游资讯、资讯分类)等功能模块,在后台首页界面可以查看各种统计图和数据分析功能,如景点推荐统计、地区信息统计、星级数据统计等。

系统首页界面如下图所示。

图5-11系统首页界面

5.3.4 景点推荐管理模块的实现

管理员点击“景点推荐管理”这一菜单会显示景点推荐列表、景点推荐添加这两个子菜单,支持输入关键词进行查询,点击“详情”按钮可以查看和管理景点推荐详情,点击“查看评论”管理员可以查看并回复用户的评论信息。界面如下图所示。

图5-12景点推荐列表界面

5.3.5 爬虫数据管理模块的实现

管理员点击“爬虫数据管理”这一菜单会显示爬虫数据列表、爬虫数据添加这两个子菜单,支持输入关键词进行查询,如果想要添加新的爬虫数据信息,点击“爬虫数据添加”菜单,输入相关信息,点击“提交”按钮就可以添加了,同时可以选择某一条爬虫数据信息,点击“删除”进行删除。如下图所示。

图5-13爬虫数据列表界面

5.3.6旅游公告管理模块的实现

管理员点击“旅游公告管理”这个菜单,可以查看到系统中所有添加的系统公告,支持通过标题对系统公告进行查询,添加、删除等操作。旅游公告管理界面如下图所示。

图5-14旅游公告列表界面图

5.3.7 资源管理模块的实现

管理员点击“资源管理”这一菜单会显示旅游资讯、资讯分类这两个子菜单,管理员可以对这两部分涉及到的功能进行更新维护,更好的服务于前台用户。如下图所示。

图5-15旅游资讯列表界面图

5.3.8 系统管理模块的实现

管理员点击“系统管理”这一菜单会显示轮播图这一个子菜单,管理员可以对前台展示的轮播图进行设置,界面如下图所示。

图5-16 系统管理界面图

第六章  系统测试

6.1 测试目标

系统测试是用于检查软件的质量、性能、可靠性等是否符合用户需求。一套严谨的、规范的、完善的测试过程将大大提高软件的质量、可信度、可靠性,降低软件的出错率,降低用户风险系数。通过在计算机上对系统进行测试试验并从中发现此系统中存在的问题和错误然后加以修改,使之更加符合用户需求。

1.测试的目的是通过测试来发现程序在执行过程中的错误的过程。

2.好的测试方案是可以检验出还未被发现的错误的方案。

3.好的测试是发现了到目前为止还未被发现的错误的测试。

4.该系统能够完成系统用户、爬虫数据管理、景点分类管理、地区信息管理、景点推荐管理、星级数据管理、系统管理(轮播图管理)、留言管理、旅游公告管理、资源管理(旅游资讯、资讯分类)等功能,做到所开发的系统操作简单,尽量使系统操作不受用户对电脑知识水平的限制。

6.2 功能测试

下表是系统登录功能测试用例,检测了用户名和密码的不同的输入情况,观察系统的响应情况。得出该功能达到了设计目标。

表6-1 系统登录功能测试用例

功能描述

用于系统登录

测试目的

检测登录时的合法性检查

测试数据以及操作

预期结果

实际结果

输入的用户名和密码带有非法字符

提示用户名或者密码错误

与预期结果一致

输入的用户名或者密码为空

提示用户名或者密码错误

与预期结果一致

输入的用户名和密码不存在

提示用户名或者密码错误

与预期结果一致

输入正确的用户名和密码

登录成功

与预期结果一致

下表是注册功能测试用例,检测了各种数据的输入情况,观察系统的响应情况。得出该功能达到了设计目标。

表6-2 注册功能测试用例

功能描述

用于用户注册

测试目的

检测用户注册时的合法性检查

测试数据以及操作

预期结果

实际结果

输入的手机号不合法

提示请输入正确的手机号码

与预期结果一致

输入的字段为空

提示必填项不能为空

与预期结果一致

输入的密码少于6位

提示密码必须为6-12位

与预期结果一致

输入的密码大于12位

提示密码必须为6-12位

与预期结果一致

下表是景点推荐管理功能的测试用例,检测了景点管理中对景点推荐的增加,删除,修改,查询操作是否成功运行。观察系统的响应情况,得出该功能也达到了设计目标,系统运行正确。

前置条件;管理员登录系统。

表6-3 景点推荐管理的测试用例

功能描述

用于景点推荐管理

测试目的

检测景点推荐管理时的各种操作的运行情况

测试数据以及操作

预期结果

实际结果

点击添加景点推荐,必填项合法输入,点击保存

提示添加成功

与预期结果一致

点击添加景点推荐,必填项输入不合法,点击保存

提示必填项不能为空

与预期结果一致

点击修改景点推荐,必填项修改为空,点击保存

提示必填项不能为空

与预期结果一致

点击修改景点推荐,必填项输入不合法,点击保存

提示必填项不能为空

与预期结果一致

点击删除景点推荐,选择景点推荐删除

提示删除成功

与预期结果一致

点击搜索景点推荐,输入存在的景点推荐名

查找出景点推荐

与预期结果一致

点击搜索景点推荐,输入不存在的景点推荐名

不显示景点推荐

与预期结果一致

6.3. 测试结果

经过对此系统的测试,得出该系统足以满足普通用户日常需求,在功能项目和操作等方面也能满足管理员对于普通用户的管理。但是,还有很多功能有待添加,这个系统仅能满足大部分的需求,还需要对此系统的功能更进一步的完善,这样使用起来才能更加的完美。

第七章  总结与展望

在开发本基于数据挖掘的旅游推荐系统之前,首先通过网上查询现有的旅游景点推荐系统功能、线下通过问卷调查的方式,了解普通用户对旅游景点推荐的具体需求,对系统的开发背景以及基于数据挖掘的旅游推荐系统的研究现状进行研究,设计了本基于数据挖掘的旅游推荐系统具体实现的功能;确定好功能后,第二步就是开发工具的选择,在设计本基于数据挖掘的旅游推荐系统的时候,采用了现下比较流程的Pythong语言、Flask框架,数据的存储方面采用的是开源的MYSQL。接下来就是对系统需求的分析,在文中主要通过对基于数据挖掘的旅游推荐系统进行可行性、性能、功能、用例、业务流程五个方面进行分析,确定了本基于数据挖掘的旅游推荐系统的具体功能,功能确定后就是对系统的设计以及数据库等方面,最终完成系统的开发,对系统进行测试总结。

在开发本基于数据挖掘的旅游推荐系统的过程中我成长了很多,学习到了很多书本上没有的知识,目前系统虽然已经完成,但是还有许多地方需要改进,比如界面布局方面,代码的编写方面,都可以进一步完善,由于自己专业知识的浅薄,系统做的并不是十分完美,以后我会不断进行学习,对系统进行完善,希望有机会能够投入到学校的使用当中,给同学们提供便利。


参考文献

[1]王必祥.基于景区状态信息的景点推荐系统的设计与实现[D].南京邮电大学,2023.DOI:10.27251/d.cnki.gnjdc.2023.000110.

[2]李晓芳.基于注意力机制和画像的旅游路线推荐研究[D].南京邮电大学,2023.DOI:10.27251/d.cnki.gnjdc.2023.000398.

[3]Telonis G ,Panteli A ,Boutsinas B .A Point-of-Interest Recommender System for Tourist Groups Based on Cooperative Location Set Cover Problem[J].Mathematics,2023,11(17):

[4]班航.基于旅游大数据的用户画像建模及个性化推荐研究[D].安徽工程大学,2023.DOI:10.27763/d.cnki.gahgc.2023.000038.

[5]占贻畅.旅游景点客流量预测与个性化推荐算法研究[D].长春工业大学,2023.DOI:10.27805/d.cnki.gccgy.2023.000583.

[6]高珺.基于子空间聚类算法的湖南旅游推荐研究[D].中南林业科技大学,2023.DOI:10.27662/d.cnki.gznlc.2023.000899.

[7]田运.基于位置社交网络的旅游景点推荐模型研究与系统实现[D].辽宁大学,2023.DOI:10.27209/d.cnki.glniu.2023.000914.

[8]李恩.基于用户推荐算法的武汉市红色旅游平台设计与实现[D].长江大学,2023.DOI:10.26981/d.cnki.gjhsc.2023.001455.

[9]完颜兵.基于Flink的个性化旅游推荐系统的研究与开发[D].广西民族大学,2023.DOI:10.27035/d.cnki.ggxmc.2023.000299.

[10]陈勇.基于协同过滤算法的旅游推荐系统的设计[J].价值工程,2022,41(30):160-162.

[11]Yue W ,Zhaoxiang Q ,Jun T , et al.Optimization of Digital Recommendation Service System for Tourist Attractions Based on Personalized Recommendation Algorithm[J].Journal of Function Spaces,2022,2022

[12]杨帆.基于深度学习的旅游推荐技术研究[D].海南大学,2022.DOI:10.27073/d.cnki.ghadu.2022.000190.

[13]杨雯丽.基于语境感知的旅游推荐研究及实现[D].上海师范大学,2022.DOI:10.27312/d.cnki.gshsu.2022.001660.

[14]Shuangqin L .Implementation of Personalized Scenic Spot Recommendation Algorithm Based on Generalized Regression Neural Network for 5G Smart Tourism System[J].Computational Intelligence and Neuroscience,2022,20223704494-3704494.

[15]许洋.基于知识图谱的旅游路线推荐系统[D].内蒙古大学,2022.DOI:10.27224/d.cnki.gnmdu.2022.001162.

[16]黎楷文.基于知识图谱与深度学习的个性化旅游推荐[D].海南大学,2022.DOI:10.27073/d.cnki.ghadu.2022.000193.

[17]李志敏.基于数字文化旅游系统的推荐算法研究[D].青海师范大学,2022.DOI:10.27778/d.cnki.gqhzy.2022.000223.

[18]蒋佳媛.基于点评数据的个性化景点推荐研究[D].上海财经大学,2021.DOI:10.27296/d.cnki.gshcu.2021.002275.

[19]罗毅夫.基于深度学习的昆明市旅游路线推荐算法研究[D].云南财经大学,2021.DOI:10.27455/d.cnki.gycmc.2021.000191.

[20]柏思佳.基于用户画像的旅游景点推荐方法研究[D].哈尔滨商业大学,2021.DOI:10.27787/d.cnki.ghrbs.2021.000304.


致谢

在此论文完成之际,感谢我的指导老师。在指导老师的网页设计课上,当时我学到了很多东西,这对于我实习过程中也打了一定的基础,而且指导老师对于我的设计也提出许多建议,并予以悉心的指导,对于一些细小的问题都耐心的指导我去完善,授予我写论文的交流消息,时常的鼓励我,另外感谢教导我完善此项目的前端同学,对于这个项目,我是边学习边实现完成的,有许多东西开始并不是很明白,但前端开发的同学非常耐心的引导我去将这个项目完成,在系统的后端开发中,所用到的后台开发技术也时常会给我讲解,助于我更好的将论文完成,在此对帮助到我的同学和一直予以教导的指导老师致以衷心的感谢,祝事业有成。

点赞+收藏+关注  →私信领取本源代码、数据库

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值