TripGenie：畅游济南旅行规划助手：团队工作纪实（一）(含说明文件)-CSDN博客

本文链接：https://blog.csdn.net/m0_74808467/article/details/146439797

一、总述

在数字化转型的浪潮中，旅游业也迎来了新的发展机遇。我们团队致力于开发一款济南景点一体化旅游助手，旨在为用户提供全面、个性化的旅游信息和服务。面对数据不全面和更新不及时的挑战，我们决定采用爬虫技术，从各大网站爬取济南的景点、住宿、美食等信息。

在项目启动阶段，我们组织了多次团队会议，明确了项目的目标和主题。我们希望建立一个平台，不仅提供济南的景点信息，还包括住宿、美食等旅游相关资源。这个平台将成为游客了解济南、规划行程的重要助手。确定了项目主题后，我们开始撰写项目书、申请书、答辩PPT，详细规划了项目的各个方面，包括目标用户、功能需求、技术路线、开发计划和预算等。项目书是指导我们整个开发过程的蓝图。

面对数据获取的难题，我们决定学习并应用爬虫技术。团队成员开始学习爬虫的基础知识，包括HTTP协议、HTML结构、JavaScript动态内容等。我们了解了网站的反爬虫机制，并学习了如何模拟浏览器行为，以绕过这些限制。

在工具选择方面，我们我们选择了Python作为主要开发语言，并引入了一系列爬虫工具：

Requests：用于发送HTTP请求，获取网页内容。

BeautifulSoup 与lxml：用于解析HTML文档，提取所需数据。

- Selenium：用于模拟浏览器行为，处理JavaScript动态生成的内容。

- Pandas：用于数据处理和存储，方便将爬取的数据保存为CSV文件。

我们团队成员分工，分别爬取了大众点评等多个网页，以大众点评为例，我们实施了以下爬虫步骤：

1. 获取URL：找到大众点评上目标数据所在的页面URL。

2. 模拟登录获取Cookie：模拟用户登录，获取Cookie以绕过反爬虫限制。

3. 爬取数据：使用获取的Cookie，爬取目标网页上的数据。

在数据处理阶段，面对不同网站对同一景点可能存在的命名格式差异、文件中不需要的信息，页码与序号与景点名称的统一问题，标题不清晰的CSV文件等问题，进行了讨论与修改。在数据库整合，团队选择使用MySQL进行数据整合。首先，我们将数据导入数据库中，然后计划将坐标与景点、酒店、美食等信息进行合并。我们选择使用`LEFT JOIN`操作来确保即使某些景点在`point`表中没有对应的记录，仍然会显示在结果集中。

```sql

SELECT

h.name AS TouristName,

h.address AS Address,

h.comment AS Comments,

h.picture AS Picture,

h.rating AS Rating,

p.point AS Point

FROM

tourist h

LEFT JOIN

points p ON h.id = p.tourist_id;

通过这一系列的步骤，我们的项目已经取得了显著的进展。从主题确定到数据清理，每个阶段都为项目的成功奠定了坚实的基础。我们期待在接下来的分析和报告阶段中，将这些数据转化为有价值的见解和建议。

二、TripGenie：畅游济南旅行规划助手文档

(一)需求定义

TripGenie 是一款面向计划前往济南旅游的用户的智能旅行规划助手软件。其核心目标是通过集成基于大型语言模型（LLM）的智能体技术和 POI（兴趣点）空间优化技术，为用户提供有价值、个性化且高效的济南旅行规划服务。该软件将涵盖从用户需求获取、个性化行程规划、信息整合与推荐到便捷交互的全流程旅行规划服务，以提升用户旅行前的准备效率和体验质量，帮助用户充分领略济南的历史文化、自然景观和城市风情。

(二)需求分析

2.1用户需求获取

智能体与用户初次对话时，需具备高效的沟通能力，在1-3轮对话之内精准挖掘用户的关键旅行需求。这些关键需求包括但不限于用户的出行人数及组成（如独自旅行、家庭亲子游等）、兴趣偏好（像对历史文化遗迹、自然风光、美食、娱乐活动等不同类型景点的兴趣倾向）。准确获取这些信息是后续为用户提供虚拟个性化的行程规划服务的基石。

2.2个性化行程规划

一站式推荐：参考传统旅行社成熟的 “门票 + 交通” 模式，智能体能够整合资源，为用户提供更多维度的旅行规划建议。这种方式可以有效缩短用户查询相关信息的平均时间，提升旅行规划的效率，让用户能够将更多精力放在享受旅行本身上。
个性化方案生成：智能体依据用户多维度的个性化需求，运用智能算法生成 2 到 3 个各具特色的行程方案供用户选择。以带孩子出行的家庭为例，行程方案将充分考虑儿童的喜好和适合度，优先推荐如济南融创乐园、方特东方神画等适合儿童游玩的景点，并搭配周边适合家庭居住且儿童友好的酒店，规划合理的交通路线，确保整个行程既有趣又轻松，满足家庭旅行的需求。同时，对于不同的方案，需确保其具有较小的平均边际（AM）和重叠次数（OL），即方案之间的景点、活动和行程安排尽量避免高度相似，为用户提供专属且多样化的选择。

2.3信息获取与存储

数据爬取：利用爬虫技术，智能体将定期从大众点评、携程、百度地图等权威且信息丰富的旅游平台爬取济南的景点、美食等相关数据。这些数据涵盖景点的介绍、评价、门票价格、开放时间，美食餐厅的菜品推荐、人均消费、口味评价等关键信息。通过及时更新爬取的数据，确保用户所获取的旅行参考信息是最新的，为准确的决策依据。
数据存储：在数据爬取过程中，除了存储基础的文字信息外，还将对济南市的景点、住宿、美食等信息的图片以链接形式存储到数据库中，每条信息存储 1 到 3 张具有代表性的图片，以便在后续向用户展示时能够更直观地呈现景点的风貌、美食的外观。同时，爬取并存储景点的星级评定、餐厅的人均价格等附加信息，完善用户对各个旅行要素的全面认知。

2.4深化济南文化特色融入

文化景点与活动推荐：智能体将深入挖掘并积极推荐济南的舜耕文化、大明湖文化、李清照故居等具有深厚历史文化底蕴的景点，引导游客探索济南独特的历史脉络和文化传承。同时，结合济南丰富的民俗文化资源，推荐沉浸式文化体验活动，如传统戏曲表演（如吕剧等）、泉水文化讲座、非遗手工制作（如鲁绣、济南黑陶制作等），让游客在旅行过程中不仅欣赏到表面的风景，更能深入感受济南的文化魅力，留下深刻难忘的旅行记忆。
主题行程设计：针对历史文化爱好者这一特定群体，智能体将精心设计 “泉城文化” 主题行程。该行程将有机串联起趵突泉、大明湖、李清照故居、五龙潭等多个著名历史文化景点，并巧妙结合济南的泉水节、花灯会等特色文化活动，按照合理的游览路线和时间安排，为游客打造一个全方位、深度体验济南文化的特色旅行方案，满足游客对历史文化深度游的需求。

2.5景点与活动推荐

智能体能够针对济南的大明湖、趵突泉、千佛山等热门景点，提供详尽且准确的信息服务。这些信息包括景点的详细介绍、预约方式（如线上预约平台、预约时间等）、门票价格（不同季节、不同人群的票价优惠政策）、营业时间（旺季和淡季可能存在的差异）、特定活动的时间与位置安排（例如趵突泉的灯光秀时间、大明湖的划船活动区域等），确保这些重要信息的准确率在 95% 以上。此外，智能体还会根据季节变化的特点和规律，推荐相应的特色景点。例如，在春季，推荐正处于花期的济南植物园、百花公园等，为用户呈现济南不同季节的独特美景。

2.6行程优化与贴心服务

交通推荐：智能体将充分整合济南公交网、携程、高德地图等权威交通平台的数据资源，根据用户的出行地点、时间和预算等条件，为用户提供服务的交通推荐。推荐内容涵盖市内公交线路、地铁线路等多种交通方式的组合方案。其目标是将平均推荐响应时间严格控制在不超过 10 秒，让用户能够迅速获取交通信息，便捷地规划整个旅行行程的交通环节，确保旅途的顺畅衔接。
天气提醒：智能体会在旅行规划过程中提前查询济南的天气情况，并依据天气状况为用户提供特定的出行建议。例如，遇到雨天时，提醒用户调整行程安排，优先选择室内景点（如博物馆、科技馆等）或文化体验活动，并提示用户携带雨具等注意事项；在高温天气下，建议用户合理安排行程，避免长时间户外活动，并推荐避暑纳凉的好去处。同时，智能体具备实时天气信息更新功能，确保用户能够根据最新的天气变化及时做出合理的行程调整，保障旅行的安全和舒适度。

2.7智能交互与地图展示

交互体验优化：智能体在与用户交流以及展示旅行规划信息时，将以清晰、逻辑有序的方式逐条列出可选择的景点、住宿、济南特色美食推荐等内容，以及每个行程环节的预估时间安排。用户可以通过简单的鼠标点击操作，方便快捷地浏览和筛选自己感兴趣的项目，并可随时对行程安排进行调整和修改，极大地提升用户的交互体验质量。
地图标注与展示：智能体依托先进的地图 API 技术，在地图上精确标注景点的位置以及景点之间的相对位置关系。用户可以在地图界面中自由缩放查看细节信息，点击具体景点时，系统会自动弹出该景点的详细介绍和相关参考链接，方便用户进一步了解景点详情。整个地图的加载时间将严格控制在不超过 5 秒，且从用户点击操作到信息展示的交互响应时间不超过 3 秒，确保用户能够快速、便捷地获取所需信息，实现高效的旅行规划和决策。

2.8行程导出与用户反馈

行程导出功能：用户在完成旅行规划后，可以将智能体生成的济南行程规划（包括详细的日程安排、景点门票信息、交通安排等）、景点图文介绍以及其他相关旅行信息等内容导出为 PDF 文件。整个导出过程简单便捷，，方便用户将行程规划分享给同行伙伴或打印出来随身携带，随时参考使用，确保旅行过程有条不紊。
用户反馈机制：在前端页面设置专门的用户反馈板块，用户可以对智能体提供的服务进行评分（如 1 - 5 分的星级评分）和文字评价，针对智能体的回答质量、行程规划合理性、信息准确性等方面提出意见和建议。智能体将建立完善的用户反馈处理机制，对用户的反馈信息进行及时收集、分类和分析，将其作为持续优化服务质量、改进算法模型和提升用户体验的重要依据。

(三)软件设计

3.1架构设计

前端：采用响应式设计，通过清晰、美观且易于操作的界面，向用户展示景点推荐、行程规划、交通信息等丰富的旅行规划内容。利用 HTML、CSS和 JavaScript 等技术构建页面架构和交互效果，并借助 Vue.js 框架实现页面的动态渲染和组件化开发，提升开发效率和用户体验。
后端：基于 Python 的 Flask 框架搭建，负责处理核心业务逻辑。包括智能体对话管理、行程规划算法调用、数据爬取任务调度、与其他 API的数据交互等。后端将对前端发送的用户请求进行分析处理，并返回相应的数据和操作结果，保障整个系统的稳定运行和高效响应。
数据库：选用 MySQL 关系型数据库存储结构化数据，包括用户信息、景点、美食等 POI 数据以及爬取的图片链接、评分等附加信息。通过合理设计数据库表结构和索引，优化数据查询和存储效率，为前端展示和后端业务逻辑处理提供可靠的数据支持。

3.2模块设计

智能体模块：作为软件的核心模块，基于 LLM 技术实现与用户的自然语言对话交互。在对话过程中，智能体通过精心设计的对话策略和引导问题，在1-3轮对话内精准获取用户的关键旅行需求信息，并将其传递给行程规划模块。同时，智能体能够结合用户的偏好和实时反馈，对生成的行程规划进行动态调整和优化，并以友好、清晰的方式将规划结果展示给用户。
数据爬取模块：负责定时从大众点评、携程、百度地图等外部数据源爬取济南的景点、美食等 POI 数据。该模块采用多线程和反爬虫处理技术，确保数据爬取的效率和稳定性。爬取到的数据经过清洗和预处理后，按照统一的数据格式存储到数据库中，并定期更新，保证数据的时效性和准确性。
行程规划模块：根据用户需求信息和数据库中的 POI 数据，运用智能算法（如启发式搜索算法、遗传算法等）生成 2 - 3 个个性化的旅行行程方案。在规划过程中，充分考虑景点之间的空间布局、开放时间、用户的兴趣偏好以及旅行时间等因素，确保行程的合理性和可操作性。同时，结合 POI 检索技术和 RAG（检索增强生成）架构，为行程中的每个景点、酒店等推荐附加的详细信息和参考链接，丰富行程内容。
交互展示模块：负责前端界面的展示和用户交互功能的实现。包括景点、美食等信息的列表展示、地图标注和展示、行程规划的可视化呈现等。通过优化界面布局和交互设计，提升用户的操作便捷性和视觉体验。用户在浏览和选择旅行规划内容时，可以通过简单的点击、滑动等操作获取详细信息，并对行程进行个性化调整和导出操作。
交通天气模块：整合济南公交网、携程、高德地图等交通平台的数据 API，实现交通推荐功能。根据用户的出发地、目的地和旅行时间等条件，快速查询并推荐合适的交通方式和路线，确保平均推荐响应时间不超过 10 秒。同时实时获取济南的天气信息，并结合天气状况为用户提供个性化的出行建议。在遇到天气变化时，及时提醒用户调整行程安排，保障旅行的安全和舒适度。