202311
1 intro
1.1 背景
- 公共活动(音乐会、体育赛事等)常常在特定时间吸引大量访客到特定地点,导致旅行需求不规律激增
- 为了维护活动场地的安全并确保交通系统的顺畅运行,准确预测这些活动的旅行需求模式至关重要
- 之前已经提出了许多旅行需求预测方法
- 但它们通常忽略了由公共活动引起的不规则移动模式
- 互联网和社交媒体平台的广泛采用为收集活动细节提供了新途径
- 活动组织者在售票网站和社交媒体上宣传他们的活动,突出显示重要细节如日期、时间、地点和文本描述
- 先前的研究已证明这类在线信息在提高特殊事件下的移动性预测准确性方面的潜力
- 大多数研究仅整合了数值或分类数据,包括活动类别、时间和相关社交媒体帖子的数量。通常忽视的是,事件描述中丰富的文本信息,它可以提供有关活动主题、参与者和背景细节的宝贵见解
1.2 三个挑战
- 有效利用在线活动描述中丰富的文本数据,这些数据在结构和深度上常常不同
- 一些活动附带的文本描述很少,需要模型进行更深层的语义理解
- 例如,对于一个如“WALK THE MOON”这样的事件描述,传统语言模型可能无法立即解释为是美国摇滚乐队Walk the Moon的音乐会
- 对于详细描述的事件,模型需要筛选描述以提取相关信息
- 例如,如果一个事件描述深入讲述了表演者的生平故事,那么对于语言模型来说,区分无关细节和移动性预测相关信息将会很有挑战性。
- 一些活动附带的文本描述很少,需要模型进行更深层的语义理解