基于spark的旅游数据分析与推荐系统-计算机毕业设计源码36286

摘要

本文旨在阐述一个基于Spark技术的旅游数据分析与推荐系统。鉴于旅游业之繁荣发展,对旅游景区数据之深度解析与高效利用已成为不可或缺之环节。该系统充分运用了Spark之分布式计算能力及其卓越的数据处理性能,并与Java版大数据紧密结合。

该系统通过广泛收集并深入分析来自不同景区的多维度数据,诸如游客流量、收入状况及游客满意度等,为景区管理者提供了全面而精准的运营分析报告。使得用户能够轻松获取定制化的数据报告。

此系统不仅助力旅游管理部门及景区经营者深入了解景区运营状况,优化资源配置,提升服务质量,而且为整个旅游行业的决策与发展提供了坚实的数据支持。该系统通过对比分析不同景区的数据,为行业提供了宝贵的参考信息,进而促进了旅游业的持续健康发展。

关键词:基于spark的旅游数据分析与推荐系统;Java版大数

Abstract

This paper aims to describe a travel data analysis and recommendation system based on Spark technology. In view of the prosperous development of tourism, the in-depth analysis and efficient use of the data of tourist attractions has become an indispensable link. The system makes full use of Spark's distributed computing power and its excellent data processing performance, and is closely integrated with Java big data.

The system provides comprehensive and accurate operation analysis reports for scenic spot managers through extensive collection, and thorough analysis of multidimensional data from different scenic spots, such as tourist flow, income status and tourist satisfaction. Enables users to easily obtain customized data reports.

This system not only helps the tourism management departments and the scenic spot operators to have a deep understanding of the scenic spot operation status, optimize the allocation of resources and improve the service quality, but also provides a solid data support for the decision-making and development of the entire tourism industry. By comparing and analyzing the data of different scenic spots, the system provides valuable reference information for the industry, and then promotes the sustainable and healthy development of tourism.

Keywords: travel data analysis and recommendation system based on spark; Java version of big data

目录

摘要

Abstract

1. 绪论

1.1  选题依据

1.2 国内外研究现状

1.2.1国内研究现状

1.2.2国外研究现状

1.3  相关技术介绍

1.3.1 spark框架介绍

1.3.2 MySQL数据库

1.3.3 B/S结构

1.3.4 JAVA大数据

1.4论文结构与章节安排

2.系统分析

2.1 可行性分析

2.2系统功能分析

2.2.1 功能性分析

2.2.2 非功能性分析

2.4 系统用例分析

2.5本章小结

3 旅游数据分析与推荐系统总体设计

3.1 系统架构设计

3.2 系统功能模块设计

3.2.1整体功能模块设计

3.3 数据库设计

3.3.1 数据库概念结构设计

3.3.2 数据库逻辑结构设计

4.系统实现

4.1  普通用户功能模块

4.2  管理员功能模块

5.系统测试

5.1  测试目的

5.2  测试方法

5.3  功能测试

5.4  测试结论

6.结  论

参考文献

结束语

1. 绪论

1.1  选题依据

旅游业是现代经济中的重要组成部分,而景区作为旅游业的核心资源之一,其运营和管理对于整个旅游行业的发展至关重要。然而,传统的景区管理往往缺乏全面、准确的数据支持,无法及时了解和把握景区的运营状况。

因此,开展基于spark的旅游数据分析与推荐系统具有重要意义。spark作为一种分布式计算平台,能够有效处理大规模的数据,并具备高容错性和可扩展性。通过利用spark平台,实现数据的统一管理和分析。

该选题的依据还在于数据分析和可视化的重要性。通过对景区数据进行多维度的分析,如游客数量、收入、满意度等指标的统计和比较,可以更好地了解景区的运营情况和特点。同时,将分析结果以图表、地图等形式进行可视化呈现,能够直观地展示景区的运营情况,帮助管理者快速获取信息和做出决策。

通过开发基于spark的旅游数据分析与推荐系统,可以为旅游管理部门和景区经营者提供准确、全面的数据支持,帮助他们更好地了解和把握景区的运营状况,优化资源配置和服务质量。同时,通过对不同景区数据的对比和分析,还可以为旅游业的整体发展提供参考和决策依据。

总之,基于spark的旅游数据分析与推荐系统选题的依据在于满足旅游行业对数据支持和决策需求的迫切性,以及spark平台在大数据处理方面的优势。通过该系统的开发,有望推动旅游行业的信息化建设,促进旅游业的健康发展。

1.2 国内外研究现状

1.2.1国内研究现状

目前,基于spark的旅游数据分析与推荐系统在国内得到了广泛的研究和应用。随着大数据技术的发展和旅游行业的快速增长,越来越多的研究者开始利用spark平台对旅游景区的数据进行深入挖掘和分析,并通过可视化手段将分析结果直观地展示出来。

在国内的研究现状中,许多学者和企业都致力于构建基于spark的旅游景区数据分析平台。他们通过收集景区相关的大量数据,如游客数量、游客来源、景点评价、天气情况等,利用spark的分布式计算和存储能力,对这些数据进行处理和分析。通过运用数据挖掘等技术,他们可以发现潜在的规律和趋势,提供有效的决策支持和市场预测。

此外,研究者还借助可视化工具和技术,将分析结果以图表、地图等形式呈现出来,使管理者和决策者可以更直观地理解和利用这些数据。例如,通过热力图展示不同时期的游客密度分布,通过折线图展示游客数量的变化趋势,通过地理信息系统展示游客来源的空间分布等。这些可视化手段不仅可以帮助景区管理者了解和优化景区运营,也可以为市场调研和旅游规划提供重要参考。

总体而言,在国内已经形成了一定的基于spark的旅游数据分析与推荐系统的研究现状。未来随着技术的不断发展和应用的深入推广,这一领域将会取得更加丰富和成熟的成果,为旅游行业的发展和决策提供更强有力的支持。

1.2.2国外研究现状

在国外,基于spark的旅游数据分析与推荐系统也引起了广泛的关注和研究。许多国外学术界和企业已经开始利用spark平台对旅游景区的数据进行处理和分析,并且将结果以可视化的形式呈现出来。

国外的研究者们通过使用spark的分布式计算和存储能力,能够有效地处理大规模的旅游景区数据集,包括游客数量、游客特征、游览路线等。他们运用各种数据挖掘和机器学习技术,例如聚类分析、关联规则挖掘和预测模型等,来发现隐藏在数据中的有价值的信息和趋势。

此外,国外研究者还致力于开发可视化工具和技术,以更好地展示旅游景区数据的分析结果。他们利用图表、地图、虚拟现实等手段,将数据转化为易于理解和解释的形式。例如,他们可以使用交互式地图来显示不同景点的热度和游客流量,或者使用动态图表来展示游客行为的变化趋势。这些可视化方法不仅使数据更加生动和直观,同时也帮助决策者更好地理解旅游市场的动态和需求。

总体而言,在国外的研究现状中,基于spark的旅游数据分析与推荐系统已经取得了显著的进展。通过利用大数据技术手段,研究者们能够更好地理解旅游景区的运行状况和市场需求,从而为相关决策提供有力的支持。未来,随着技术的不断发展和应用的深入,这一领域将会继续取得新的突破和创新,为全球旅游产业的可持续发展做出贡献。

1.3  相关技术介绍

1.3.1 spark框架介绍

Spark框架是一个用于大规模数据处理的统一分析引擎,提供了丰富的API和内置工具,支持批处理、实时流处理、机器学习和图计算等任务。其核心抽象概念是弹性分布式数据集(RDD),这是一个可并行操作的分布式数据集,具有容错性和可恢复性,并提供了丰富的转换和动作操作,用于数据处理和分析。

Spark框架的主要特点是其快速性,这主要得益于其数据结构和任务运行方式。Spark将数据封装到集合RDD中,并调用RDD中的函数来处理数据,这些数据可以放在内存中,如果内存不足也可以放到磁盘中。此外,Spark的任务运行方式是以线程方式运行,相比于MapReduce中以进程方式运行的任务,线程的启动和销毁更快,因此Spark能够更高效地处理数据。

然而,需要注意的是,Spark并不能完全替代Hadoop。虽然Spark在数据处理速度上优于Hadoop中的MapReduce计算模型,但Hadoop生态系统中的其他组件(如HDFS、HBase等)仍然具有很高的实用价值。因此,在实际应用中,需要根据具体需求来选择合适的工具和技术。

总之,Spark框架是一个强大而灵活的大数据处理工具,适用于各种类型的数据处理和分析任务。其快速、高效的特点使其在处理大规模数据时具有显著优势。

1.3.2 MySQL数据库

MySQL数据库拥有众多优势,它的操作简单易懂,只需要几行代码即可完成所需的功能,而且不受任何平台的限制,无论是什么样的环境,都可以轻松地使用,因此,无论是软件开发者还是其他人,都可以利用MySQL数据库来完成系统的开发,并且还可以为软件开发者节省大量的成本。此外,由于其存储容量庞大,操作简单,使得它成为软件开发的首选。由于其强大的功能,我们可以放心地将其作为该系统的最佳数据存储方式。

MySQL数据库具备强大的容错性和安全性,它的开源性和稳定性让它变成了各种软件开发者的首选。它的功能和特性已经得到了大幅度的改善,它的特性和优势让它变成了各种系统的理想选择。它的操作十分便捷,仅仅通过几步的编程,即可完成各种复杂的数据库管理,无论你正处于什么样的环境,它的性价比都会大大增强。MySQL数据库因其出色的性能、可靠性、扩展等特性,已经作为数据库系统领域的佼佼者,在系统的开发过程中,其尺寸极其紧凑,而且开发费用极其实惠,因此得到了广泛的使用,并且在各种数据处理场景下,都得到了广泛的采纳。

1.3.3 B/S结构

B/S架构是目前应用最广泛的架构模式,它不仅能够让系统的开发变得更加简单易操作,而且还能够方便地进行维护。使用这种架构,只需要在电脑上安装一个数据库,并配置一些常见的浏览器即可。通过B/S架构,浏览器和数据库之间可以实现各种功能,而且这种架构的使用方式大大降低了维护成本。此外,由于所有的数据库之间都是完全独立的,因此这种架构具有极高的安全性。B/S架构的优势在于,它可以实时监控系统处理的业务,从而帮助管理者快速做出决策,从而减少学校的损失。此外,它的核心特性是采用集中式管理,用户可以将生成的数据存储到系统的数据库中,以便日后查阅和使用,从而满足不同的需求。

1-1 B/S模式三层结构图

1.3.4 JAVA大数据

Java在处理大数据方面提供了一些强大的工具和方法。其中,MapReduce框架是一个经典的大数据处理框架,最早由Google公司推出,具有广泛的应用。MapReduce的核心思想是将大数据分成小块,然后每个小块都分别处理,处理结果再进行合并。该框架可以使用Java编程实现,具有高可扩展性和并行处理能力,适合处理大数据集。

此外,Java还广泛应用于数据库管理系统的开发,如Oracle、MySQL等数据库服务器都可以使用Java开发。通过数据库管理系统,可以将数据存储到数据库中,并使用Java语言访问数据库。

在Java处理大数据的过程中,还可以使用注解来提高代码的质量和可靠性。注解是以“@注解名”在代码中存在的,可以添加一些参数值。例如,@Override注解用于检测被修饰的方法是否是有效的重写方法,若不是则报编译错误;@Deprecated注解可用于表示被标记的数据已经过时(但还可以正常使用),不建议使用。

另外,Java还提供了JUnit测试框架,用于测试代码的正确性,以确保代码在修改后仍然能够正常工作。通过JUnit测试,可以快速发现代码中的错误,并及时修复它们,从而提高代码的质量和可靠性。

总之,Java在处理大数据方面提供了多种强大的工具和方法,包括MapReduce框架、数据库管理系统、注解和JUnit测试框架等。这些工具和方法可以帮助开发人员更加高效、准确地处理大数据,提高代码的质量和可靠性。

1.4论文结构与章节安排

论文将分层次经行编排,除去论文摘要致谢文献参考部分,正文部分还会对网站需求做出分析,以及阐述大体的设计和实现的功能,最后罗列部分调测记录,论文主要架构如下:

第一章:绪论。第一章主要介绍了课题的选题依据,系统开发的现状和相关技术介绍。

第二章:系统需求分析。第二章主要从系统的用户、功能等方面进行需求分析。

第三章:系统设计。第三章主要对系统框架、系统功能模块、数据库进行功能设计。

第四章:系统实现。第四章主要介绍了系统框架搭建、系统界面的实现。

第五章:系统测试。第五章主要对系统的部分界面进行测试并对主要功能进行测试

第六章:总结。

2.系统分析

2.1 可行性分析

(1)操作可行性:

此次项目设计参考了几个该模式下网站的开发案例,对他们的操作界面分析,将众多案例结合在一起,突出以人为本简化操作,所以具有基本计算机知识的人都会操作本项目。

因此操作可行性也没有问题。

(2)技术可行性:

技术可行性指的是对于搭建框架的可行性,以及有更优秀的技术出现时系统的技术更新换代的纳新性如何,开发时间成本费用比如何。

现有的Java大数据技术能够迎合所有电子商务系统的搭建。开发本系统的时候我采用了Java大数据+MYSQL用以运行整体程序。

综上所述技术可行性也没有问题。

(3)法律可行性:

从开发者角度来看,Java大数据和MYSQL是网上开源且免费的,在知识产权方面不会产生任何法律纠纷。

从用户使用角度来看,只要不再系统上贩卖违禁品,对系统做出条约协议,杜绝非法支付即可。

综上所述法律可行性也没有问题。

2.2系统功能分析

2.2.1 功能性分析

按照基于spark的旅游数据分析与推荐系统的角色,我划分为了普通用户管理模块、和管理员管理模块这两大部分。

普通用户管理模块:

普通用户:
(1)注册登录:普通用户通过注册登录系统,可通过点击头像中我的账户,对个人信息进行增删改查。比如个人资料、头像和密码修改。
(2)通知公告:用户点击可查看网站公告、关于我们、联系方式和网站介绍。
(3)旅游资讯:用户点击可通过局部搜索进行筛选查看旅游资讯,
(4)排行信息:用户点击可通过搜索排行标题、排行标签和发布日期进行查看排行信息列表,同时可对排行信息进行点赞、收藏、评论操作。
(5)个人中心:用户点击头像可查看“个人中心”,包括(个人首页、收藏)。

管理员:
(1)登录:管理员的账号是在数据列表中直接设置生成的,不需要进行注册,可直接输入账号密码登录,同时可对管理员资料进行增删改查。
(2)系统用户:当管理员点击“系统用户”时,可管理管理员和普通用户,同时可对系统用户进行增删改查。
(3)攻略数据管理:管理员点击可查看攻略数据列表和攻略数据添加;同时可通过下载导入文档进行导入攻略数据信息。
(4)景点数据管理:管理员点击可查看景点数据列表和景点数据添加;同时可通过下载导入文档进行导入景点数据信息。
(5)排行信息管理:管理员点击可查看排行信息列表和排行信息添加,支持查询、删除、添加。
(6)系统管理:当管理员点击“系统管理”时,可查看轮播图; 如需添加新的轮播图,点击右侧“添加”按钮,上传图片,输入标题,点击“确认”按钮进行添加;同时可对轮播图进行增删改查。
(7)通知公告管理:当管理点击“通知公告管理”时,可查看通知公告;如需添加新的通知公告信息,点击右侧“添加”按钮,输入标题和正文,点击“确认”按钮进行添加。
(8)资源管理:当管理员点击“资源管理”时,可查看旅游资讯和分类列表。如需添加新的旅游资讯,点击“添加”按钮,上传封面图,输入标题,选择分类,输入标签、描述和正文,点击“提交”按钮进行添加。同时可对

2.2.2 非功能性分析

旅游数据分析与推荐系统的非功能性需求比如旅游数据分析与推荐系统的安全性怎么样,可靠性怎么样,性能怎么样,可拓展性怎么样等。具体可以表示在如下2-1表格中:

2-1旅游数据分析与推荐系统非功能需求表

安全性

主要指旅游数据分析与推荐系统数据库的安装,数据库的使用和密码的设定必须合乎规范。

可靠性

可靠性是指旅游数据分析与推荐系统能够按照用户的指示进行操作,经过测试,可靠性90%以上。

性能

性能是影响旅游数据分析与推荐系统占据市场的必要条件,所以性能最好要佳才好。

可扩展性

比如数据库预留多个属性,比如接口的使用等确保了系统的非功能性需求。

易用性

用户只要跟着旅游数据分析与推荐系统的页面展示内容进行操作,就可以了。

可维护性

旅游数据分析与推荐系统开发的可维护性是非常重要的,经过测试,可维护性没有问题

2.4 系统用例分析

通过2.3功能的分析,得出了本旅游数据分析与推荐系统的用例图

管理员用例图如下:

图2-1 管理员用例图

普通用户用例图如下:

图2-2普通用户用例图

2.5本章小结

本章主要通过对旅游数据分析与推荐系统的可行性分析、流程分析、功能需求分析、系统用例分析,确定整个旅游数据分析与推荐系统要实现的功能。同时也为旅游数据分析与推荐系统的代码实现和测试提供了标准。

3 旅游数据分析与推荐系统总体设计

本章主要讨论的内容包括旅游数据分析与推荐系统的功能模块设计、数据库系统设计。

3.1 系统架构设计

本旅游数据分析与推荐系统从架构上分为三层:表现层(UI)、业务逻辑层(BLL)以及数据层(DL)。

图3-1旅游数据分析与推荐系统架构设计图

表现层(UI):又称UI层,主要完成本旅游数据分析与推荐系统的UI交互功能,一个良好的UI可以大大提高用户的用户体验,增强用户使用本旅游数据分析与推荐系统时的舒适度。UI的界面设计也要适应不同版本的旅游数据分析与推荐系统以及不同尺寸的分辨率,以做到良好的兼容性。UI交互功能要求合理,用户进行交互操作时必须要得到与之相符的交互结果,这就要求表现层要与业务逻辑层进行良好的对接。

业务逻辑层(BLL):主要完成本旅游数据分析与推荐系统的数据处理功能。用户从表现层传输过来的数据经过业务逻辑层进行处理交付给数据层,系统从数据层读取的数据经过业务逻辑层进行处理交付给表现层。

数据层(DL):由于本旅游数据分析与推荐系统的数据是放在服务端的mysql数据库中,因此本属于服务层的部分可以直接整合在业务逻辑层中,所以数据层中只有数据库,其主要完成本旅游数据分析与推荐系统的数据存储和管理功能。

3.2 系统功能模块设计

3.2.1整体功能模块设计

在上一章节中主要对系统的功能性需求和非功能性需求进行分析,并且根据需求分析了本旅游数据分析与推荐系统中的用例。那么接下来就要开始对本旅游数据分析与推荐系统的架构、主要功能和数据库开始进行设计。旅游数据分析与推荐系统根据前面章节的需求分析得出,其总体设计模块图如图3-2所示。

图3-2 旅游数据分析与推荐系统功能模块图

3.3 数据库设计

数据库设计一般包括需求分析、概念模型设计、数据库表建立三大过程,其中需求分析前面章节已经阐述,概念模型设计有概念模型和逻辑结构设计两部分。

3.3.1 数据库概念结构设计

下面是整个旅游景区数据分析及可视化中主要的数据库表总E-R实体关系图。

图3.3  旅游数据分析与推荐系统总E-R关系图

3.3.2 数据库逻辑结构设计

通过上一小节中旅游数据分析与推荐系统中总E-R关系图上得出一共需要创建很多个数据表。在此我主要罗列几个主要的数据库表结构设计。

表access_token (登陆访问时长)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

token_id

int

10

0

N

Y

临时访问牌ID

2

token

varchar

64

0

Y

N

临时访问牌

3

info

text

65535

0

Y

N

4

maxage

int

10

0

N

N

2

最大寿命:默认2小时

5

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

6

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

7

user_id

int

10

0

N

N

0

用户编号:

表article (文章:用于内容管理系统的文章)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

article_id

mediumint

8

0

N

Y

文章id:[0,8388607]

2

title

varchar

125

0

N

Y

标题:[0,125]用于文章和html的title标签中

3

type

varchar

64

0

N

N

0

文章分类:[0,1000]用来搜索指定类型的文章

4

hits

int

10

0

N

N

0

点击数:[0,1000000000]访问这篇文章的人次

5

praise_len

int

10

0

N

N

0

点赞数

6

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

7

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

8

source

varchar

255

0

Y

N

来源:[0,255]文章的出处

9

url

varchar

255

0

Y

N

来源地址:[0,255]用于跳转到发布该文章的网站

10

tag

varchar

255

0

Y

N

标签:[0,255]用于标注文章所属相关内容,多个标签用空格隔开

11

content

longtext

2147483647

0

Y

N

正文:文章的主体内容

12

img

varchar

255

0

Y

N

封面图

13

description

text

65535

0

Y

N

文章描述

表article_type (文章分类)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

type_id

smallint

5

0

N

Y

分类ID:[0,10000]

2

display

smallint

5

0

N

N

100

显示顺序:[0,1000]决定分类显示的先后顺序

3

name

varchar

16

0

N

N

分类名称:[2,16]

4

father_id

smallint

5

0

N

N

0

上级分类ID:[0,32767]

5

description

varchar

255

0

Y

N

描述:[0,255]描述该分类的作用

6

icon

text

65535

0

Y

N

分类图标:

7

url

varchar

255

0

Y

N

外链地址:[0,255]如果该分类是跳转到其他网站的情况下,就在该URL上设置

8

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

9

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表attraction_data (景点数据)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

attraction_data_id

int

10

0

N

Y

景点数据ID

2

attraction_name

varchar

64

0

Y

N

景点名称

3

attraction_address

varchar

64

0

Y

N

景点地址

4

ctrip_rating

varchar

64

0

Y

N

携程评分

5

ctrip_popularity

varchar

64

0

Y

N

携程热度

6

number_of_evaluators

varchar

64

0

Y

N

评价人数

7

details_link

varchar

255

0

Y

N

详情链接

8

comment_content

text

65535

0

Y

N

评论内容

9

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

10

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表auth (用户权限管理)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

auth_id

int

10

0

N

Y

授权ID:

2

user_group

varchar

64

0

Y

N

用户组:

3

mod_name

varchar

64

0

Y

N

模块名:

4

table_name

varchar

64

0

Y

N

表名:

5

page_title

varchar

255

0

Y

N

页面标题:

6

path

varchar

255

0

Y

N

路由路径:

7

position

varchar

32

0

Y

N

位置:

8

mode

varchar

32

0

N

N

_blank

跳转方式:

9

add

tinyint

3

0

N

N

1

是否可增加:

10

del

tinyint

3

0

N

N

1

是否可删除:

11

set

tinyint

3

0

N

N

1

是否可修改:

12

get

tinyint

3

0

N

N

1

是否可查看:

13

field_add

text

65535

0

Y

N

添加字段:

14

field_set

text

65535

0

Y

N

修改字段:

15

field_get

text

65535

0

Y

N

查询字段:

16

table_nav_name

varchar

500

0

Y

N

跨表导航名称:

17

table_nav

varchar

500

0

Y

N

跨表导航:

18

option

text

65535

0

Y

N

配置:

19

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

20

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表collect (收藏)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

collect_id

int

10

0

N

Y

收藏ID:

2

user_id

int

10

0

N

N

0

收藏人ID:

3

source_table

varchar

255

0

Y

N

来源表:

4

source_field

varchar

255

0

Y

N

来源字段:

5

source_id

int

10

0

N

N

0

来源ID:

6

title

varchar

255

0

Y

N

标题:

7

img

varchar

255

0

Y

N

封面:

8

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

9

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表comment (评论)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

comment_id

int

10

0

N

Y

评论ID:

2

user_id

int

10

0

N

N

0

评论人ID:

3

reply_to_id

int

10

0

N

N

0

回复评论ID:空为0

4

content

longtext

2147483647

0

Y

N

内容:

5

nickname

varchar

255

0

Y

N

昵称:

6

avatar

varchar

255

0

Y

N

头像地址:[0,255]

7

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

9

source_table

varchar

255

0

Y

N

来源表:

10

source_field

varchar

255

0

Y

N

来源字段:

11

source_id

int

10

0

N

N

0

来源ID:

表hits (用户点击)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

hits_id

int

10

0

N

Y

点赞ID:

2

user_id

int

10

0

N

N

0

点赞人:

3

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

4

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

表notice (公告)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

notice_id

mediumint

8

0

N

Y

公告id:

2

title

varchar

125

0

N

N

标题:

3

content

longtext

2147483647

0

Y

N

正文:

4

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

5

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表praise (点赞)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

praise_id

int

10

0

N

Y

点赞ID:

2

user_id

int

10

0

N

N

0

点赞人:

3

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

4

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

8

status

bit

1

0

N

N

1

点赞状态:1为点赞,0已取消

表ranking_information (排行信息)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

ranking_information_id

int

10

0

N

Y

排行信息ID

2

ranking_title

varchar

64

0

Y

N

排行标题

3

ranking_tags

varchar

64

0

Y

N

排行标签

4

release_date

date

10

0

Y

N

发布日期

5

cover_photo

varchar

255

0

Y

N

封面图片

6

content_details

longtext

2147483647

0

Y

N

内容详情

7

hits

int

10

0

N

N

0

点击数

8

praise_len

int

10

0

N

N

0

点赞数

9

recommend

int

10

0

N

N

0

智能推荐

10

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

11

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表regular_users (普通用户)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

regular_users_id

int

10

0

N

Y

普通用户ID

2

user_name

varchar

64

0

Y

N

用户姓名

3

user_gender

varchar

64

0

Y

N

用户性别

4

contact_phone_number

varchar

16

0

Y

N

联系电话

5

examine_state

varchar

16

0

N

N

已通过

审核状态

6

user_id

int

10

0

N

N

0

用户ID

7

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表slides (轮播图)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

slides_id

int

10

0

N

Y

轮播图ID:

2

title

varchar

64

0

Y

N

标题:

3

content

varchar

255

0

Y

N

内容:

4

url

varchar

255

0

Y

N

链接:

5

img

varchar

255

0

Y

N

轮播图:

6

hits

int

10

0

N

N

0

点击量:

7

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

8

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

表strategy_data (攻略数据)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

strategy_data_id

int

10

0

N

Y

攻略数据ID

2

strategy_title

text

65535

0

Y

N

攻略标题

3

details_link

varchar

255

0

Y

N

详情链接

4

number_of_views

varchar

64

0

Y

N

浏览数量

5

liked_quantity

varchar

64

0

Y

N

喜欢数量

6

number_of_replies

varchar

64

0

Y

N

回复数量

7

publication_time

varchar

64

0

Y

N

发表时间

8

days_of_play

varchar

64

0

Y

N

游玩天数

9

travel_month

varchar

64

0

Y

N

出行月份

10

per_capita_amount

varchar

64

0

Y

N

人均金额

11

companion_style

varchar

64

0

Y

N

结伴方式

12

strategy_gameplay

varchar

64

0

Y

N

攻略玩法

13

create_time

datetime

19

0

N

N

CURRENT_TIMESTAMP

创建时间

14

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间

表upload (文件上传)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

upload_id

int

10

0

N

Y

上传ID

2

name

varchar

64

0

Y

N

文件名

3

path

varchar

255

0

Y

N

访问路径

4

file

varchar

255

0

Y

N

文件路径

5

display

varchar

255

0

Y

N

显示顺序

6

father_id

int

10

0

Y

N

0

父级ID

7

dir

varchar

255

0

Y

N

文件夹

8

type

varchar

32

0

Y

N

文件类型

表user (用户账户:用于保存用户登录信息)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

user_id

mediumint

8

0

N

Y

用户ID:[0,8388607]用户获取其他与用户相关的数据

2

state

smallint

5

0

N

N

1

账户状态:[0,10](1可用|2异常|3已冻结|4已注销)

3

user_group

varchar

32

0

Y

N

所在用户组:[0,32767]决定用户身份和权限

4

login_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

上次登录时间:

5

phone

varchar

11

0

Y

N

手机号码:[0,11]用户的手机号码,用于找回密码时或登录时

6

phone_state

smallint

5

0

N

N

0

手机认证:[0,1](0未认证|1审核中|2已认证)

7

username

varchar

16

0

N

N

用户名:[0,16]用户登录时所用的账户名称

8

nickname

varchar

16

0

Y

N

昵称:[0,16]

9

password

varchar

64

0

N

N

密码:[0,32]用户登录所需的密码,由6-16位数字或英文组成

10

email

varchar

64

0

Y

N

邮箱:[0,64]用户的邮箱,用于找回密码时或登录时

11

email_state

smallint

5

0

N

N

0

邮箱认证:[0,1](0未认证|1审核中|2已认证)

12

avatar

varchar

255

0

Y

N

头像地址:[0,255]

13

open_id

varchar

255

0

Y

N

针对获取用户信息字段

14

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

15

vip_level

varchar

255

0

Y

N

会员等级

16

vip_discount

double

11

2

Y

N

0.00

会员折扣

表user_group (用户组:用于用户前端身份和鉴权)

编号

名称

数据类型

长度

小数位

允许空值

主键

默认值

说明

1

group_id

mediumint

8

0

N

Y

用户组ID:[0,8388607]

2

display

smallint

5

0

N

N

100

显示顺序:[0,1000]

3

name

varchar

16

0

N

N

名称:[0,16]

4

description

varchar

255

0

Y

N

描述:[0,255]描述该用户组的特点或权限范围

5

source_table

varchar

255

0

Y

N

来源表:

6

source_field

varchar

255

0

Y

N

来源字段:

7

source_id

int

10

0

N

N

0

来源ID:

8

register

smallint

5

0

Y

N

0

注册位置:

9

create_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

创建时间:

10

update_time

timestamp

19

0

N

N

CURRENT_TIMESTAMP

更新时间:

4.系统实现

4.1  普通用户功能模块

个人中心:个人中心:用户点击头像可查看“个人中心”,包括(个人首页、收藏)。界面图如下。

图4.1  个人中心界面

旅游资讯:用户点击可通过局部搜索进行筛选查看旅游资讯,界面图如下。

图4.2 旅游资讯界面

排行信息:用户点击可通过搜索排行标题、排行标签进行查看排行信息列表,同时可对排行信息进行点赞、收藏、评论操作。界面图如下。


图4.3排行信息界面

4.2  管理员功能模块

攻略数据管理:管理员点击可查看攻略数据列表和攻略数据添加,同时可通过下载导入文档进行导入攻略数据信息。界面如下:

图4.4攻略数据管理界面

景点数据管理:管理员点击可查看景点数据列表和景点数据添加,同时可通过下载导入文档进行导入景点数据信息。界面如下:

图4.5景点数据管理界面

排行信息管理:管理员点击可查看排行信息列表和排行信息添加;同时可进行增删改查。界面图如下。

图4.6 排行信息管理界面

系统管理:当管理员点击“系统管理”时,可查看轮播图; 如需添加新的轮播图,点击右侧“添加”按钮,上传图片,输入标题,点击“确认”按钮进行添加;同时可对轮播图进行增删改查。界面图如下。

图4.7 系统管理界面

资源管理:当管理员点击“资源管理”时,可查看旅游资讯和分类列表。如需添加新的旅游资讯,点击“添加”按钮,上传封面图,输入标题,选择分类,输入标签、描述和正文,点击“提交”按钮进行添加。同时可对资讯进行增删改查。界面图如下。

图4.8资源管理界面

5.系统测试

5.1  测试目的

系统开发到了最后一个阶段那就是系统测试,系统测试对软件的开发其实是非常有必要的。因为没什么系统一经开发出来就可能会尽善尽美,再厉害的系统开发工程师也会在系统开发的时候出现纰漏,系统测试能够较好的改正一些bug,为后期系统的维护性提供很好的支持。通过系统测试,开发人员也可以建立自己对系统的信心,为后期的系统版本的更新提供支持。

5.2  测试方法

经过精心设计的两种测试手段,我们有效地检查了系统,以确定其是否正常工作,并及早发现潜在的缺陷,从而确保其顺利实施。在考虑软件的内部结构与实际执行之间的关联时,我们可以使用黑盒测试或白盒测试。

(1)通过使用黑盒测试,我们可以评估系统的性能,检查它在用户的任何操作中,是否可以快速、精确地收集和处理数据,从而实现预期的目标。为了达到这一目的,我们必须仔细检查各项功能和使用步骤,以便将其全部输出和输入。

(2)通过使用白盒测试,我们可以深入了解系统的结构,从而确保它能够在运行时保持良好的性能和稳定性。

电影推荐系统的测试也会从下面几方面进行:

(1)通过对窗口的精心设计,我们可以在用户输入用户名和密码时,及时弹出界面,以便提供反馈。为此,我们进行了严格的测试,以确保每一个窗口都能够及时响应用户的操作。

(2)通过数据跟踪,我们可以及时发现系统功能的异常情况,并及时调整数据库中的信息,以满足用户的需求。此外,通过跟踪,我们还可以更加清晰地找到系统存在的问题,从而有效地解决这些问题,并保持系统的正常运行。

(3)经过综合测试,我们可以从内部和外部发现系统中的问题,并及时采取措施解决。为了满足不同用户的需求,我们应该根据实际使用情况,采取有针对性的开发方案。

5.3  功能测试

经过精心设计,这款电影推荐系统已经完美地实现了最初的期望,其各项功能的运行效果出色,完全满足用户的使用要求,并且及时纠正了大量的错误信息。总的来说,这款软件已经通过了严格的测试。

表6-1: 用户登录测试表

模块名称

测试用例

预期结果

实际结果

是否通过

登录模块

用户名:admin   密码:123  

弹出错误提示,提示密码错误

弹出错误提示,提示密码错误

通过

登录模块

用户名:123   

密码:admin   

弹出错误提示,提示用户名错误

弹出错误提示,提示用户名错误

通过

登录模块

用户名:admin   

密码:admin   

管理员登录成功

管理员登录成功

通过

表6-2:修改密码测试表

模块名称

测试用例

预期结果

实际结果

是否通过

修改密码模块

原密码:666

新密码:123

确认密码:123  

弹出错误提示,提示原密码错误

弹出错误提示,提示原密码错误

通过

修改密码模块

原密码:admin   新密码:123

确认密码:333  

弹出错误提示,提示确认密码不一致

弹出错误提示,提示确认密码不一致

通过

修改密码模块

原密码:admin   新密码:123

确认密码:123  

密码修改成功

密码修改成功

通过

5.4  测试结论

在测试每个功能的过程中,都应该严格按照指定的测试计划一步一步地进行测试,不能急于求成,并且要将每个测试的结果都进行详尽的记录,最佳的选择是采用自动化的测试,这样可以更为精确并且快速地完成测试,并不能依赖于人工测试,因为这种自动化测试的方式可以避免出现一些问题,同时也可以避免疲劳和出现问题。在进行测试时,必须保持高度的专注,密切关注测试结果,并及时纠正任何异常情况;最终,测试完成后的文档应当妥善保存,以备日后使用。

经过测试可以发现,当初制定系统的初衷是明确的,只有将其细化,编程的流程就变得更加顺畅。只有拥有良好的结构,后期的编程工作才能够顺利完成,而且还可以大大减少耗费的时间与精力。


6.结  论

    通过Java语言+MySQL数据库等各个相关技术的学习终于完成了这项系统设计,我们所研究开发的旅游数据分析与推荐系统能够更加公平与包容和便捷地满足用户的使用需求,最终实现了我们最初的开发初衷和方向。掌握Java语言+MySQL等各个技术,对于我们的系统开发工作来说极其重要。经过我们的努力付出和精心设计,我们的系统具有很多优势,满足系统使用用户的各个需求。我们对系统内的各个需求和每个部件进行了较为详细的分析,并对其采取了针对性的设计方案。经过最终测试,我们发现该系统能够正常并流畅运行,因此我们建议将其作为一个旅游数据分析与推荐系统。

Java技术在该系统开发的过程中被广泛采用,java技术的代码编写比较简单且易懂,并且不受平台和技术的各种限制,拥有很出色的面向对象的特性,所以说在技术上已经十分成熟。利用java技术来进行支撑系统的运行,能够使系统实现每一项功能。在本次系统的设计编写过程中,我们面临着许多挑战,但是我们得益于老师和同学们的支持,最终经过我们的努力成功地实现了这一项重要的任务。

参考文献

[1]刘方磊. 信创背景下旅游大数据分析系统的设计与对比 [J]. 数字通信世界, 2024, (01): 52-54.

[2]王浩,张海芹. 旅游生活化:“网红城市”旅游者行为与体验特征研究——基于百度指数和UGC的淄博市游客大数据分析 [J]. 干旱区资源与环境, 2024, 38 (02): 173-180.

[3]刘蕾,鄢章华. 黑龙江省旅游行业在线评论数据分析 [J]. 时代经贸, 2023, 20 (10): 126-130. DOI:10.19463/j.cnki.sdjm.2023.10.003.

[4]Xiao Z ,Ali Y ,Xin W , et al. Sports Work Strategy of College Counselors Based on MySQL Database Big Data Analysis [J]. International Journal of Information Technology and Web Engineering (IJITWE), 2023, 18 (1): 1-14.

[5]胡安安,郭梦珂,黄丽华等. 政府旅游数据开放的评价指标体系构建与组态分析:基于21个省级行政区的数据 [J/OL]. 大数据, 1-27[2024-03-24]. http://kns.cnki.net/kcms/detail/10.1321.G2.20230921.1027.002.html.

[6]闫巧致,黄晓君,林哲. 智慧旅游大数据应用分析 [J]. 西安航空学院学报, 2023, 41 (05): 67-75.

[7]赵建华,刘宁,殷瑞梓. 基于网络文本大数据的商洛市康养旅游市场分析 [J]. 商洛学院学报, 2023, 37 (04): 16-22+58.

[8]张宇坤,王光伟,肖英伦. 基于抖音数据分析的旅游目的地的传播主体研究——以桂林市为例 [J]. 现代营销(上旬刊), 2023, (08): 165-167.

[9]胡婷,张朝枝,赵莹等. 山地文化旅游对目的地客流时间分布的影响——基于泰山客流的大数据分析 [J]. 山地学报, 2023, 41 (03): 435-445.

[10]黄凌子. 基于Spark的旅游舆情热点发现方法研究[D]. 三峡大学, 2023.

[11]Miguel V ,Isabel G ,Luis A , et al. Spark discharge generator as a stable and reliable nanoparticle synthesis device: Analysis of the impact of process and circuit variables on the characteristics of synthesized nanoparticles [J]. Advanced Powder Technology, 2023, 34 (3):

[12]Johny M ,Edward M ,Gunung H , et al. Development of short sea shipping in the north coast of Java Island, Indonesia as a potential market [J]. Transportation Research Interdisciplinary Perspectives, 2023, 18

[13]穆芃芃. 基于大数据分析的旅游景区管理策略优化研究 [J]. 旅游纵览, 2022, (11): 194-196.

[14]刘燕. 基于大数据技术的智能旅游数据间的相关性分析及应用研究 [J]. 林业调查规划, 2022, 47 (03): 181-184.

[15]迟殿委. 旅游酒店大数据分析平台的设计与实现 [J]. 无线互联科技, 2022, 19 (07): 89-92+98.

[16]王国泰. 游客行为数据接入与智能推荐方法研究[D]. 桂林电子科技大学, 2021.

[17]曹崴,邓凯,郝彤宇等. 基于大数据分析的旅游景区发展问题与对策分析——以长春市净月潭为例 [J]. 科技经济市场, 2021, (05): 104-105.

[18]龚花,陈琦,陈名辉. 基于大数据分析的旅游景区管理策略优化研究 [J]. 广西质量监督导报, 2020, (10): 40-41.

[19]严宇,王啸楠. 基于大数据分析的旅游景点信息平台的模型设计 [J]. 计算机产品与流通, 2020, (10): 154.

[20]陈丙先. 东盟国际旅游发展研究——基于近十年的东盟国际旅游数据分析 [J]. 社会科学家, 2020, (08): 44-49.

结束语

论文终于写完了,非常感谢你的阅读。在这过程中,我特别要感谢我的导师。虽然实习时我忙得不可开交,论文也是写写停停,但导师始终耐心负责,经常关心我的进度。在他的帮助下,我终于完成了论文和程序。我从导师身上学到了很多宝贵的知识和经验,这对我来说受益匪浅。同时,我也发现了自己的不足,无论是技术上还是工作态度上,导师都像一面镜子,让我看清了自己的缺点。

此外,我还要感谢实习期间帮助过我的同学和社会人士。之前我对SpringBoot框架一窍不通,但他们给了我很多启发和想法,还帮我调试和检测程序。没有他们,我肯定无法顺利完成这次毕业设计。现在,我的毕业设计终于画上了圆满的句号。

免费领取项目源码,请关注❥点赞收藏并私信博主,谢谢~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值