交通政策中的社交媒体与用户生成内容:位置数据与实际应用
1. 位置数据识别
在交通领域,运营者和管理者通常关注从社交媒体中识别与自身负责的交通服务密切相关的信息。大多数发布在交通管理部门或供应商正式网站上的消息可能与当地相关,但由于交通系统存在网络结构,上下游的交通活动也可能与特定地理位置相关。不同的管理部门可能负责交通系统网络的不同部分,且有不同的网站。例如,关于城际和本地服务衔接的投诉可能发布在城际服务运营商的网站上,但对寻求改善衔接服务的本地供应商也有价值。
因此,需要从众多可用消息中识别出与特定位置和/或特定交通服务相关的消息。有两种可能的位置识别方法:
- 识别消息发布者的当前位置 :
- 文本消息发布者位置的主要信息来源是社交媒体用户账户自愿发布的地理元数据。但实际上,很多用户不提供此信息,即使消息有地理标签,也可能不准确。
- 消息可能涉及与用户家乡不同的运输位置,例如旅行时。
- 移动设备的GPS坐标可提供用户位置的隐式元数据,但这只是所有社交媒体流量的一部分,且需要用户同意。
- 研究人员正在努力提高从普及设备推断位置的精度。鉴于当前此类元数据覆盖范围的限制,也在研究其他隐式信息源用于位置推断,如社交网络结构,因为用户往往与社交网络中的同龄人居住在地理上相近的地方;还可以根据消息内容推断用户位置,特别是基于当地语言特征可以进行精细的地理区分。
- 从消息内容中识别位置 :考虑到地名的高度歧义性,这一任务具有挑战性。例如,“利物浦”可能指英国城市、伦敦火车站(利物浦街)、美国城市或澳大利亚郊区。已经提出了几种基于消息内容识别地理位置的方法:
超级会员免费看
订阅专栏 解锁全文
894

被折叠的 条评论
为什么被折叠?



