基于大数据技术的甘肃智慧旅游系统基于大数据技术的甘肃智慧旅游系统
郭亮1,2, 杨裔1,2, 秦炳峰3, 曹建文4, 李敏1,2, 袁威1, 李彩虹1,5, 王军涛6
1. 兰州大学信息科学与工程学院,甘肃 兰州 730000;
2. 旅游信息融合处理与数据权属保护文化和旅游部重点实验室,甘肃 兰州 730000;
3. 甘肃省文化和旅游厅科技信息处,甘肃 兰州 730000;
4. 兰州工业学院计算机与人工智能学院,甘肃 兰州 730050;
5. 甘肃省人工智能与算力技术重点实验室,甘肃 兰州 730000;
6. 中电万维信息技术有限责任公司,甘肃 兰州 730000
摘要:随着旅行方式的不断演变,传统旅游管理服务模式的滞后已不再满足现代游客对个性化、品质化出行的需求。为解决该问题,搭建了甘肃省智慧旅游系统。首先对相关研究进行综述,然后详细描述了系统的构成和实现过程,包括甘肃智慧旅游大数据中心的构建和“一部手机游甘肃”综合服务平台的设计。系统通过分层架构和逻辑框架,实现了旅游数据与游客行为的关联映射,并对多元数据进行融合计算。最后,以高速公路自驾车流量预测模型、旅游目的地形象代表的图片选择模型和旅游评论情感影响因素分析模型为例,阐述了综合服务平台面向政府、业态、游客提供的智能化服务。应用成效表明,该系统的实施有效地提高了甘肃地区旅游服务的质量和游客满意度,进一步推动了甘肃智慧旅游的快速发展。
关键词:智慧旅游 ; 大数据 ; 系统应用 ; 旅游管理 ; 游客体验
论文引用格式:
郭亮, 杨裔, 秦炳峰, 等. 基于大数据技术的甘肃智慧旅游系统[J]. 大数据, 2024, 10(1): 157-169.
GUO L, YANG Y, QIN B F, et al. Gansu smart tourism system based on big data[J]. Big Data Research, 2024, 10(1): 157-169.
0 引言
随着大数据、物联网和深度学习技术的发展,近年来智慧旅游平台建设在全国范围内掀起了高潮。人民生活水平不断提高,人民群众旅游出行模式不断发生改变,传统的服务、管理和运营模式已经明显不能适应新的出行需求,因此智慧旅游平台的建设成为推动我国文旅事业发展的战略性举措。为游客提供更优质的旅游体验,进一步增强游客在旅游过程中的获得感和满意度,是实现全民旅游愉悦体验的重要途径,也是智慧旅游平台建设的宗旨和目标。
2014年被原国家旅游局定为“智慧旅游年”。同年8月,国务院颁布《国务院关于促进旅游业改革发展的若干意见》。2015年1月,原国家旅游局印发《关于促进智慧旅游发展的指导意见》,推动了智慧旅游的建设。
随着全国智慧旅游平台建设的加速,各省市逐渐开启了智慧旅游平台的建设,并且随着文化部和国家旅游局的合并,智慧旅游平台建设也开始向文旅融合、纵向贯通、横向融通的方向发展。2020年11月,文化和旅游部联合十部委,发布了《关于深化“互联网+旅游”推动旅游业高质量发展的意见》,提出当前重点任务是加快建设智慧旅游景区。2021年,甘肃省文化和旅游厅印发《甘肃省“十四五”智慧文旅发展规划》,提出推动5G、大数据、云计算、人工智能、物联网、区块链等技术对全省文化旅游业全链条智能化提升,推动文化旅游创作、生产、消费、服务、管理全面智慧化,丰富数字文旅产品业态,拓展文旅消费空间,创新经营管理模式,着力构建数据支撑、科技引领、业态创新、跨界融合的智慧文旅生态。2023年4月,工业和信息化部、文化和旅游部联合印发《关于加强5G+智慧旅游协同创新发展的通知》。在此背景下,智慧旅游越来越受到重视,智慧旅游平台也由建设投入向运营造血方向开始转变。
甘肃省文化旅游资源富集,文化旅游产业也是甘肃省十大生态产业之一。2018年,甘肃省人民政府办公厅印发《关于加快全省智慧旅游建设的意见》,在全国率先提出了省级智慧旅游平台建设的顶层设计和规划,提出要着力打造“一平台、一中心、三体系、三朵云”的重点工作。其中,“一平台”为“一部手机游甘肃”综合服务平台,以“金牌导游、贴心管家、文化导师、全能导购”为目标,实现全省4A级和5A级旅游景区智能导游导览、线路规划、语音讲解、VR全景、分时预约、门票预订、数字阅读、数字展览,以及酒店预订、导游预约、网络约车、特产订购、旅游投诉等功能。“一中心”为甘肃文化旅游大数据中心,以“互联互通、多元融合、精准分析、全面共享”为基本思路,纵向贯通了市县旅游部门及景区、酒店、旅行社数据,完成旅游景区视频监控信号接入。
1 相关工作
智慧旅游系统建设的关键在于数据的融合处理、预测分析、关联处理、因果分析。目前,多源、异构旅游数据的动态抽取、清洗、关联、存储、融合处理过程仍面临诸多挑战。本文汇总了旅游行业在大数据方面的相关研究工作。
旅游业是一个由交通、住宿、餐饮、游览、购物以及文娱六大环节构成的综合性行业。每一个环节都会产生大量的数据,如在搜索引擎上搜索旅游景区、攻略以及特色小吃等产生的数据,游客在OTA (online travel agency)平台上的消费数据、评论数据,游客分享在社交媒体平台(微博、博客、推特等)上的图片携带的地理位置信息和运行轨迹数据等。这些数据有游客主动分享的数据,也有服务商和运营商获取的隐性数据。通过查阅文献和资料,本文将旅游大数据的来源归为以下7个方面(如图1所示):①网络搜索引擎产生的数据;②运营商的基站数据;③游客分享在社交媒体上的数据;④OTA平台数据;⑤广告营销数据;⑥客流量数据;⑦经济数据和气象数据。
图1 旅游大数据的来源和应用
Bi等人基于LSTM方法使用搜索引擎数据,提出了适用于预测我国两个著名旅游景点(九寨沟和黄山)的游客流量数据的模型。Li等人提出了一种基于百度搜索引擎数据的客流量预测模型,并取得了较好的预测结果。邓宁等人通过对YouTube视频数据进行分析,比较了目的地营销组织和国外游客在北京目的地形象建构上的异同。Figueredo等人使用Facebook、Instagram和谷歌Plus 3个社交媒体上的图片来检测游客的隐性偏好并推荐景点。Xiao等人利用游客分享的旅游目的地照片,从构图场景、视觉审美品质和视觉独特性3个方面分析图像,开发了一套整合旅游目的地多项指标的客观形象投影方案,以改善目的地营销。Águeda等人挖掘分析了Yelp平台上的14 000条与不同旅游产品相关的评论,从中找出主要的潜在主题和用户情绪。Guizzardi等人使用OTA大数据提高了动态价格的预测性能,为智能决策提供了参考。Arici等人[8]基于TripAdvisor上的酒店评论数据,分析了10个国家在评论数量和客户满意度评分方面的差异。Salas-Olmedo等人则指出使用单一数据源并不能很好地挖掘游客的空间行为,他们同时使用3种数据源(Panoramio(观光)、Foursquare(消费)和Twitter(联网住宿))的数据进行分析,发现这3种类型的数据是部分互补的。Law等人利用香港入境人数预测了日本赴港游客人数。Bi等人结合每日天气状况数据,挖掘景点的游客流量和天气状况之间的关联关系。在旅游大数据辅助运营方面,贵向泉等人提出了一种基于区块链的旅游积分通兑系统,利用区块链技术去中心化、难以篡改、安全可靠的特点,实现积分在用户间的自由流通。这些研究工作为智慧旅游平台的建设提供了理论支撑。
上述数据多源异构,量大且复杂。从结构上来看,大约20%为结构化数据, 80%为图片、文本、音频等非结构化数据。对于异构数据,Jimenez-Marquez等人提出了一个既可以用于结构化数据,也可以用于非结构化数的两阶段数据分析框架,包括数据集成和挖掘分析阶段。Bin等人提出了一种异构旅游数据集成方法,以下载的游记博客、旅游属性和电子地图数据为基础,构建兴趣点(points of interest,POI)知识库和海量结构化的POI访问序列。
2 甘肃智慧旅游系统
甘肃智慧旅游系统由“一平台、一中心、三体系、三朵云”构成,即“一部手机游甘肃”综合服务平台,甘肃旅游大数据中心,智慧旅游服务体系、管理体系、营销体系,以及智慧旅游支撑云、内容云、功能云。图2所示为甘肃智慧旅游系统的总体架构。其中省级文化旅游大数据中心主要面向游客、行业以及政府,通过基于深度学习的多源、异构旅游数据与游客行为关联映射技术,挖掘海量的多行业旅游数据的关联信息,构建更加精准的游客画像,为游客提供更个性化、精准化的服务,为旅游从业者提供提质增效的数据依据,为旅游管理部门提供动态精准的决策支撑。其可促进甘肃旅游公共信息服务水平显著提高,旅游在线营销能力全面提升,行业监管能力进一步增强。
图2 甘肃智慧旅游系统的总体架构
2.1 甘肃旅游大数据中心
甘肃旅游大数据中心主要面向政府旅游管理部门,接入电信、移动、联通、公安、公路、铁路、民航、气象、环保、景区、OTA平台、微信、其他网络平台13类数据,对行业数据进行信息化加工,构建相应的数据模型,从客流分析、客源地分析、游客属性分析、客流目的地分析、游客画像分析、车辆交通分析、网络舆情分析、宣传统计分析八大类数据维度出发,实现旅游相关数据的实时统计分析。甘肃旅游大数据中心主要服务于甘肃省文化和旅游厅以及下级旅游部门,为相关部门的数据统计、发展规划等工作提供依据,并且为游客流量预测、景点管理水平评价、交通拥挤程度分析、应急态势分析与处理提供数据支持和保障。图3所示为甘肃省景区和场馆分时预约数据的景区画像,包括预约入园人数、入园时间分布、游客年龄分布、客源排行分析、相关旅游路线图谱、旅游目的地影响力指数等信息,可为景区运营提供专业数据支撑。
图3 甘肃智慧旅游大数据中心
甘肃旅游大数据中心的构建包括以下关键部分:旅游数据与游客行为关联映射分层架构、数据库群构建及多元数据融合计算逻辑框架,以及旅游数据与游客行为关联映射技术处理构架。
2.1.1 旅游数据与游客行为关联映射分层架构
通过数据采集技术采集互联网旅游开放数据,在不同场景时效性和规范性的要求下,将采集到的数据通过数据缓存层进行统一缓存。通过数据清洗层进行统一处理,结合数据映射方法,基于用户的互动行为研究行为画像构建,包括用户消费特征和出行偏好等,生成用户画像和群体画像基础数据。如图4所示,旅游数据与游客行为关联映射分层架构分为数据采集层、数据缓冲层、数据清洗层、数据映射层、数据导出层。
图4 旅游数据与游客行为关联映射分层架构
2.1.2 数据库群构建及多元数据融合计算逻辑框架
依托采集的移动通信涉旅数据、互联网涉旅开放数据、智慧城市涉旅数据(物联网、视频、监控等)、城市旅游信息与静态数据等大数据资源,规划设计一套大数据支撑系统及其规范。通过分层技术增强数据复用率、检索效率、存储效率,为系统提供标准统一的数据出入口径,构建支持数据清洗、数据去重、数据脱敏、数据转换、关联映射、数据融合、数据接口等服务能力的数据计算中台,提供交互良好、性能稳定、安全可控的管理功能及数据服务,为智慧旅游大数据中心提供高质量的数据服务和先进的计算框架。研发统一的数据接口,通过安全策略、访问控制、日志审计技术实现权限可控、调用留痕的数据服务能力。图5所示为数据库群构建及多元数据融合计算逻辑框架。
图5 数据库群构建及多元数据融合计算逻辑框架
2.1.3 旅游数据与游客行为关联映射技术处理构架
通过对旅游数据进行采集与处理,研究旅游数据处理的方法、流程和实施规范,完善多源异构数据的关联与融合应用方案,构建如图6所示的旅游数据与游客行为关联映射技术处理构架。研究旅游数据采集、标准化与批量导入技术,包括但不限于景区、街区、商圈等基于物联网的旅游数据、客流历史数据、城市旅游静态资源数据等;采用分类模型、聚类模型、回归模型、神经网络和关联规则等机器算法进行深度挖掘;研发数据采集工具,完成数据的整理与导入;研编采集数据的元数据标准、采集流程、关联处理流程标准,为旅游客流动态感知与智能疏导提供精准的数据支撑;借助内容分析、空间分析等方法,研究游客时空行为规律及游客行为的关联映射技术,建立游客行为主题数据集市。
图6 旅游数据与游客行为关联映射技术处理构架
2.2 “一部手机游甘肃”综合服务平台
“一部手机游甘肃”综合服务平台整体架构如图7所示。该平台主要面向政府、业态、游客,实现智慧管理、智慧运营、智慧服务。智慧管理体系旨在建立旅游综合监管平台,向上对接全国旅游监管平台,向下建成省、市、县三级互通的立体旅游应急指挥平台,实时掌握景区人流量、景区周边道路拥堵情况、天气情况,对突发事件进行全方位、无死角的全程预警和应急处置。智慧运营体系旨在基于游客画像,针对宣传媒体画像,精准产出宣传运营内容、策略、方案和评价体系,提升行业运营能力。智慧服务体系旨在提供订票、订房、订车、旅游线路定制、线上线下互动交流等一体化功能,面向游客提供无缝化、即时化、精确化、互动化的旅游服务;开发电子导游导览系统,为游客提供生动有趣的导游讲解、导游推荐等导游导览服务,建立面向公众的电子导游库,开展游客选择导游服务;开设一批甘肃旅游营销服务品牌专区,向游客提供酒店客房、景区人流、交通车流、天气等涉旅信息查询服务,协助游客制定、完善目的地行程。
图7 “一部手机游甘肃”综合服务平台架构
本节以3个不同角色为例,基于数据能力的代表性模型(高速公路自驾车流量预测模型、旅游目的地形象代表的图片选择模型以及旅游评论情感影响因素分析模型)进行详细阐述。
2.2.1 高速公路自驾车流量预测模型
高速公路自驾车流量预测模型主要面向政府管理服务部门,准确预测高速公路自驾游游客的入省规模、甘肃自驾旅游者行为模式,为甘肃省自驾旅游产业的发展提供决策建议,对发现旅游供给存在的问题以及提升甘肃旅游目的地形象具有重要意义。
高速公路自驾游车流量预测模型主要使用BiGRU(bidirectional gated recurrent unit)来构建模型,用于预测在不同旅游时区中的高速公路自驾游旅游人数。BIGRU是一种基于双向门控循环单元(GRU)的多变量时间序列预测方法,它结合了双向模型和门控机制,能够有效地捕捉时间序列数据中的时序关系和多变量之间的相互影响。在甘肃省12个省界入境高速公路收费站的关口历史数据的基础上,基于BiGRU能够有效地使用过去5天的车流数据预测未来1天的车流数据,从而得到甘肃省自驾旅游者短时的总体预测情况。
2.2.2 旅游目的地形象代表的图片选择模型
旅游目的地形象代表的图片选择模型主要面向游客,使用游客在互联网分享的评论文本和照片图像数据,进行兴趣点选择和分析,为游客推荐更合适的旅游目的地。
该模型首先使用LDA主题提取模型,分析旅游照片和评论文本数据;然后使用基于密度的聚类方法DBSCAN来获取图片地理信息,进行地理坐标的聚类分析,分析游客的兴趣点;最终使用卷积神经网络(CNN)对图像进行特征提取,使用长短期记忆网络(LSTM)模型,对图像集生成关键词描述,之后对关键词进行聚类分析,得到不同景区最具有代表性的旅游图片。
2.2.3 旅游评论情感影响因素分析模型
旅游评论情感影响因素分析模型主要面向业态。旅游评论文本内容直接反映了游客旅游过程中的实际体验,表达了对旅游目的地的评价。根据游客对景区的评论文本数据,可分析出游客的情感倾向,挖掘出游客对景区建设满意的方面和不满意的方面,从而对相关旅游部门进行景区建设发挥指导作用。
使用CNN与双向LSTM模型对数据进行特征提取和分类,再从正负两个方向进行LDA主题提取,最后从密集度、开放形式、本身特色、地理交通、带动效应等几个维度对旅游评论进行分析,最终得到旅游评论情感影响因素分析报告,形成旅游目的地影响力指数。
3 应用成效
截至目前,甘肃智慧旅游系统已经建设运营6年左右。甘肃智慧旅游大数据中心,纵向贯通了市县旅游部门及景区、酒店、旅行社数据,完成113个4A级和5A级旅游景区视频监控信号接入。其中,5A级景区接入率达到100%,4A级景区接入率超过80%,位居全国前列,实现了对重点景区、重点部位的实时监控,解决了重点景区“看不见、呼不应、连不上、管不住”的管理难题,提升了国家和省市县四级联动应急指挥能力。图8所示为甘肃智慧旅游大数据中心中旅游景区视频监控接入的监测界面。甘肃智慧旅游大数据中心横向对接了多类旅游数据,使数据统计更加精准高效。特别是在全国范围内率先实现了公安住宿数据、民航客流数据与旅游数据的实时共享,使旅游住宿统计卡点由原来的6 391家扩展到14 782家,得到了更完善、准确的客流数据。目前已建成客流分析、客源地分析、游客喜好分析等数据分析模型100多个。通过这些模型,相关部门和人员基本能够掌握各省份入甘游客人次和驻留时间、各市州接待游客人次和驻留时间,以及游客性别、年龄、喜好、住宿、交通等分布情况,为全省文化旅游产业发展科学决策提供了可靠依据。“甘肃景区(场馆)分时预约系统提升适老化功能”入选文化和旅游部首批发展智慧旅游提高适老化程度示范案例。2020年6月,甘肃文化旅游大数据交换共享平台被文化和旅游部评为年度文化和旅游信息化发展典型案例。
图8 旅游景区视频监控信号接入
甘肃智慧旅游系统中,“一部手机游甘肃”综合服务平台已接入全省113家4A级及以上景区导游导览信息,包括景点介绍2 390个、讲解视频2 430条、精选照片1.3万张、VR全景1 476幅,发布攻略涵盖城市目的地15个、乡村游26个、自驾游22个,推出游记1 585篇、宣传短视频865个,实现了6 843家酒店及家庭旅馆、814家农家乐、573条旅行线路、63家景区门票、9 695名注册导游的在线预订和预约。图9所示为“一部手机游甘肃”综合服务平台的主要功能界面。
图9 “一部手机游甘肃”综合服务平台主要功能
自平台上线以来,累计服务游客已超过1 500万次。2019年5月,“一部手机游甘肃”综合服务平台获得第四届中国文旅产业巅峰大会突出贡献奖、腾讯全球数字生态大会“数字文旅先锋奖”;2020年6月,被文化和旅游部评为年度文化和旅游信息化发展典型案例;2021年,被新华社评为2021公共文化服务提升典范项目(案例);2022年,在新华社主办的第九届文化和旅游融合创新论坛上入选2022公共文旅服务创优推荐案例。在“一部手机游甘肃”综合服务平台的带动下,全省文化旅游行业,特别是景区、博物馆、文化馆等一线文旅业态的数字化、网络化、智慧化建设加快推进。
4 结束语
据文化和旅游部发布的2023年上半年国内旅游数据情况,国内旅游总人次为23.84亿,比上年同期增加9.29亿,同比增长63.9%,国内旅游收入(旅游总花费)为2.3万亿元,比上年增加1.12万亿元,增长95.9%。我国旅游业呈现出快速发展、规模持续扩大、质量不断提升的特点,对于行业的运营管理提出了更高效、更精准的要求。基于此背景和需求,利用大模型和生成式人工智能技术提升现有智慧旅游平台能力,解决差异化、内容化、精准化、人性化的旅游出行需求势在必行。笔者团队未来将会在现有基础上,开展基于大模型和生成式人工智能技术的交互式智慧旅游平台建设研究,旨在塑造数字旅游内容生产与游客交互新范式,持续推进数字旅游产业创新,为旅游行业带来颠覆性的变革,引导智慧旅游产业进入新的阶段。
作者简介
郭亮(1998-),男,兰州大学信息科学与工程学院硕士生,主要研究方向为大数据分析、人工智能。
杨裔(1980-),男,博士,兰州大学信息科学与工程学院教授,主要研究方向为大数据、机器学习与人工智能。
秦炳峰(1966-),男,甘肃省文化和旅游厅科技信息处处长,主要研究方向为智慧旅游。
曹建文(1972-),男,兰州工业学院计算机与人工智能学院副教授,主要研究方向为计算机技术。
李敏(1993-),女,博士,就职于兰州大学信息科学与工程学院,主要研究方向为大数据分析、人工智能。
袁威(1995-),男,兰州大学信息科学与工程学院硕士生,主要研究方向为大数据分析。
李彩虹(1972-),女,博士,兰州大学信息科学与工程学院教授级高级实验师,主要研究方向为大数据分析、人工智能。
王军涛(1976-),男,就职于中电万维信息技术有限责任公司,主要研究大数据、人工智能及其在产业的应用。
联系我们:
Tel:010-53879208
010-53859533
E-mail:bdr@bjxintong.com.cn
http://www.infocomm-journal.com/bdr
http://www.j-bigdataresearch.com.cn/
转载、合作:010-53878078
大数据期刊
《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。
关注《大数据》期刊微信公众号,获取更多内容