设计(论文)题目 | 基于旅游行业大数据的分析服务平台的设计与实现 |
选题依据: 1.国内外有关的研究动态: 在当前社会大发展、经济大变革关键时期,旅游业的快速发展已成为推动地区经济转型升级的重要动力。大数据时代的到来,为 旅游业发展提供了新动力。早在2009 年《国务院关于加快发展旅游业的意见》就提出要以信息化为主要途径提高旅游服务效率,并且通过当前国家发展战略方向和实施重点可以共同看出,以大数据等为代表的技术手段正为旅游研究、高校教育、创新创业等方面提供较为全面的数据支撑。1959 年,美国航空公司与 IBM 公司联合开发了机票预订系统 SABRE,成为世界旅游业最早运用信息技术的案例。国内旅游业对信息技术的应用始于 20 世纪 80 年代,从酒店预订系统和航空订票系统开始发展。随着新一代信息技术在旅游业中的广泛应用,其对旅游增长的带动作用愈发明显。信息技术与旅游的关系成为旅游研究中的热门话题。 2.理论及实际意义: 大数据的应用为旅游业升级带来了新的动力,大数据在旅游业中已经有所运用,对旅游业发展起到有效促进作用。 通过对每个地区及其旅游景点及每个人身上所获取 的数据进行有效的分析生成相关内容,对于有效促进旅游发展起到了重大的作用,目前,在我国多个旅游景区,依靠大数据的充分优势,旅游景点可为旅客提供完善的销售生命周期服务(即售前、售中、售后),并且通过无纸化票务等服务,给旅客到来了诸多便利,旅游企业则可以依托大数据技术进行高效的旅游规划、产品策划、旅游投资咨询建议决策数据,提供完善的宣传、推广、营销、渠道管理等服务,有效地降低了企业投资风险与投资成本,旅游高校以及科研机构借助数据源管理、可靠的大数据分析能力等服务可以高校输出教学资源,为旅游行业相关研究、高校教育等方面提供数据与技术支持,各级政府可依靠大数据技术探索提升旅游服务质量的方式以及全面提升旅游服务质量。 |
毕业设计的主要内容及可能的创新点 主要内容: 本文主要完成了对旅行数据集通过大数据平台进行过滤清洗,利用spark进行数据分析,将分析结果导入数据库中,利用spring boot框架进行开发,使用bootstrap作为css框架。最后对MySQL数据库中的数据进行可视化分析,并在网页中展示图表,在div中以chart的形式展现。 1.数据的获取:通过使用python爬虫爬取百度大数据平台的旅行数据与旅游部公开信息。 2.理论研究:查阅资料,学习Python、Struts、Spark、Tomcat、Mysql的工作原理和实现方法等。 3.数据分析:利用Python和Spark进行数据分析计算。 4.平台的搭建:包括用户网页前端、各功能模块、支付系统的搭建。 5.功能展示:以前端页面来整合数据并展示,展示其主要功能模块包括首页模块、旅游方案模块、机场模块、分析中心模块等模块,并通过爬取国内旅游网站中全国各地区范围的旅游数据,将数据导入hdfs,经过spark清洗后导入数据库中调用jdbc读取,在分析中心模块页面中展示旅行数据、旅行指数等内容。 | |
完成研究内容的技术路线或研究方法 技术路线 1.数据收集。利用 Python 爬取中华人民共和国旅游部的公开信息以及世界银行和百度大数据平台的全国各地区范围的旅游数据。 2.数据预处理。使用spark中的filter函数进行分片处理数据存储。 3.数据二次处理。Python脚本爬取国内旅游网站中全国各地区范围的旅游数据,并将数据导入hdfs,经过spark清洗后导入数据库中调用jdbc读取,在平台页面中展示旅行数据、旅行指数等内容。 4.系统设计,进行整个系统的系统架构设计、功能模块设计、数据采集与处理模块设计、数据可视化设计、数据库设计。 5.系统实现,展示系统功能模块、实现可视化分析。 研究方法: 1.文献研究法,通过调查公开文献获得资料,从而全面地、正确地了解所要研究的问题。 2.调查法,通过调查已有实现案例等数据进行分析结合,得出正确结论。 3.比较分析法,基于各大时间段、地区地理位置的旅游数据进行比较研究分析。 4.定量分析法,分析获取到的数据,对数据集中处理,提取特征。 | |
进度安排及各阶段主要任务 2022.01.01-2022.02.01 数据探索性分析,收集数据 2022.02.02-2022.02.12 数据预处理 2022.02.12-2022.03.01 存储数据并对数据进行二次处理 2022.03.02-2022.03.22 实现系统 2022.03.23准备开题报告 2022.03.24-2022.04.25 完成毕设项目 | |
指导教师意见
指导教师签字: 年 月 日 |