山东大学项目实训团队周报(一)

目录

一、项目介绍

1.1 项目背景

1.2 项目概述

二、任务概述

三、完成情况

3.1 大模型环境配置

3.1.1 从GitHub上下载代码

3.1.2 创建一个虚拟环境

3.1.3 使用pip安装依赖

3.1.4 修改各种报错后环境配置成功

3.2 数据爬取与处理

3.2.1 网页数据爬取

3.2.2 小程序数据爬取

3.3 前端设计调研

3.3.1 地图模块调研


一、项目介绍

1.1 项目背景

        随着物质生活的丰富以及人们精神世界的需求,旅游产业正在蓬勃发展,导游行业迎来了着诸多问题和变化。文化和旅游部市场管理司副司长李晓勇在2022年3月30日新闻发布会宣布,全国导游人数约65万人,其中与旅行社签订劳动合同的导游人数超过10万人。其它为旅游景区导游,由于行业门槛低、竞争激烈等原因,景区导游的生存状态并不十分乐观。一方面,由于导游收入水平普遍偏低,许多导游难以维持生计,甚至出现了一些“黑导”和“假导”现象;另一方面,由于市场竞争激烈,一些景区为了降低成本,采取了压缩导游费用、减少导游数量等措施,导致导游的工作压力和收入水平进一步下降。

        此外,随着旅游业的发展和变化,景区导游的工作内容也在不断发生变化。例如,一些景区开始采用自助游模式,导游的角色逐渐被淡化。比如北京颐和园景区可在公众号上选择适合自己的讲解风格,在到达每个景点可以点击播放按钮收听讲解;比如苏州拙政园内提供自动讲解器,随着游客游览位置的改变,讲解会自动播放。然而两种方式都不够智能化以及难以满足游客们的个性化需求:前者缺乏与位置信息的交互,而两者缺少与游客的个性化交互,难以为游客们提供更加便捷、丰富和满意的旅行体验。

        近年来,跨模态大语言模型的蓬勃发展,也让我们将目光转向了其与旅游产业的融合。跨模态大语言模型通过在大量的文本与图片数据上进行训练,可以执行广泛的任务,包括问答、文本总结、翻译、情感分析等等。本项目我们计划实现一个基于跨模态大语言模型的AI导游移动应用,定位于济南市趵突泉景区,从视、听两个角度入手,为游客提供更个性化的导游服务。

1.2 项目概述

        “游行智友” 的开发旨在解决当前旅游服务中存在的人工导游费用高昂、水平参差不齐以及现存的电子导游系统功能单一等问题。我们的目标是利用多模态人工智能大模型,通过模型微调、压缩等技术手段,实现对真实导游的模拟,从而为用户提供近乎零成本但专业水平很高的语音解说服务,并结合图像和文本数据,实现全方位的问答功能。

        除此之外,我们计划结合GPS定位、大模型等人工智能技术,实现以下功能:

        1.实时定位与导游

        2.跨模态智能实时对话

        3.路线推荐和导览功能

二、任务概述

        本周作为我们项目的 起步阶段 ,团队全员齐心协力,共同推进项目向前发展。在各项工作中,我们明确了分工,确保了每个环节都能得到有效的推进。具体分工内容如下: 

        1.大模型环境配置

        2.数据爬取与处理

        3.前端设计调研

三、完成情况

3.1 大模型环境配置

3.1.1 从GitHub上下载代码

        https://gitcode.com/THUDM/VisualGLM-6B/overview?utm_source=csdn_blog_hover

3.1.2 创建一个虚拟环境

        我们所使用的服务器系统为Ubuntu 18.04.6 LTS (GNU/Linux 4.15.0-76-generic x86_64),GPU为A100(NVIDIA-SMI 510.54;Driver Version: 510.54;CUDA Version: 11.6)

3.1.3 使用pip安装依赖
pip install -i https://pypi.org/simple -r requirements.txt
# 国内请使用aliyun镜像,TUNA等镜像同步最近出现问题,命令如下
pip install -i https://mirrors.aliyun.com/pypi/simple/ -r requirements.txt
3.1.4 修改各种报错后环境配置成功

3.2 数据爬取与处理

3.2.1 网页数据爬取

        针对趵突泉官网,使用后羿采集器该爬虫工具进行爬取,得到每个景点的图片和介绍,其中爬取到的景点介绍作为answer。

        爬取后的数据如图示(csv文件,图片存在本地):

       因为要将景点介绍作为图片问答的answer,所以在每条景点介绍中加入“该图片指示的景点是趵突泉/漱玉泉...”,提高答案的质量,使用prompt来构建辅助问题,如“介绍一下这张图片中的景点?”、“这张图片中的景点是什么?”,同时将存在缺失或者重复的数据删去,这样得到了初步的针对趵突泉景区的图片识别问答数据集。

        处理后效果如下图(csv文件):

3.2.2 小程序数据爬取

        打开 Progress Telerik Fiddler Web Debugger ,同时使用微信小程序电脑版打开 驴迹导游 小程序,进入所需数据的页面,启动Fiddler抓包,找到我们所需的包并解析文字,将得到的文字保存。

        其余数据将作为大模型的训练数据进行数据处理,我们将景点的图片作为训练中的图像数据,使用prompt构建辅助问题,以对应图像的解说词、景点介绍作为大模型的answer,形成了小有规模的针对趵突泉景区的ChatGLM3-6B的可用数据集。

3.3 前端设计调研

3.3.1 地图模块调研

        腾讯地图由腾讯位置服务提供,具有距离计算,地点搜索,关键词输入提示等功能接口和导航,地图选点等插件。腾讯位置服务提供了针对Map组件的很多扩展功能,比如小程序插件,个性化地图,我们可以根据需要选用。接下来我们尝试在我们的小程序中引入地图组件。

1.申请开发者密钥(key)

2.下载微信小程序JavaScriptSDK

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值