论文解读(5)-GeoHG

Learning Geospatial Region Embedding with Heterogeneous Graph
2405.14135 (arxiv.org)

摘要

目前learning comprehensive region (学习综合性的地域表示)有以下两个难点:

  • 第一个是缺乏有效的特征表示
  • 第二个是因为区块间的依赖过于复杂

本文的方法:

  • geo-entity segmentation (地理实体分割)and point-of-interest(POI)integration
    用来捕获特征
  • 将空间的关联和社会环境属性统一到一个大的异构图里(heterogeneous graph),然后在高阶区域建立模型

这样的模型还有一个非常重要的特点,支持在样本很小的情况下学习

1. 简介

为了捕获地理的特征,需要有两个重要的features:

  • 一个是区域内(intra-region features)
  • 一个是区域间 (inter-region correlation)

在这里插入图片描述

所以intra可以捕获一个区域内部的环境或者社会的特征

inter则是去寻找这个高层的联系,就不再之前单纯的位置这么简单,而是去尝试get到环境之间的联系,与社会之间的联系。

在这里插入图片描述

创新点:

  • 通过异构图的结构去进行一个geospatial embedding
  • 更高效的intra region embedding(这块后面还得在具体看一下,现在感觉这一块的工作不是很多)
  • 融合了高维和低维的关系,就是不仅有地理上的关联,还有社交或者环境上的
  • 实验

2. Related Work

(这些之后可以详细找论文去看)

  • geospatial embedding
  • graph neural network for geospatial representation
  • multimodal learninig in GeoAI

3. 方法

Geospatial Region Embedding

输入是 ( S i , P i ) i = 1 I {(S_i,P_i)}^I_{i=1} (Si,Pi)i=1I
其中S就是卫星图,P是POI data、

所以最终的Embedding是这样的:
在这里插入图片描述

然后才是真的得框架部分,一共分成四个部分:
在这里插入图片描述

3.1 Intra-Region Feature Representation
  • 这一步就是如果获取域内的特征

同样对图像进行分割,一共有三个部分作为输入,卫星图、POI图还有location,即那个小块的所在位置

位置信息表示方法如下:
在这里插入图片描述

  • 就是采用了坐标和scale的方法
    在这里插入图片描述

默认情况下每一个区域是1km * 1km的,所以 D就是1

环境的Embedding
  • 方法还是分割
    首先将图片分割成多个实体:
    在这里插入图片描述

然后算每一个实体所占有的比例:
在这里插入图片描述

  • 这就是Environmental Feature Embedding
社会Embedding

和环境有点类似,但是环境在语义分割的时候已经自己分好类了,社会没有这样的操作。那怎么办呢?这篇文章就想开个办法,自己设立分类,然后归类就行,最后统计每一个类别的比例:
在这里插入图片描述

但是这样还不够,无法体现出不同POI密度之间的区别,比如一个区域有10个POI和1000个POI,光靠比例无法区分,所以引入了一个log:
在这里插入图片描述

3.2 Inter-Region Correlation Representation

下面就是解决区块之间的问题了

在这里插入图片描述

  • 用异构图来解决问题
    简单来说就是构造无向加权异构图

异构图( heterogeneous graph)是什么?
可以看这张图:
在这里插入图片描述

二阶关联:

  • 就是地理上的联系,

We construct undirected edges ERNR, Region Nearby Region (RNR) between regional nodes whose corresponding grid cells are spatially adjacent in a 3 × 3 grid, thereby encoding these local second-order dependencies.

在这里插入图片描述

  • (应该是指在3*3区域内相邻的地方构造无向边)

高阶联系:

  • 构造异构加权边(把之前的权值用上了)
    在这里插入图片描述

所以还是分了多个类别分开构图,注意下标有两个
另一个代表category

3.3 Heterogenous Graph-Based Representation
  • 然后采用了一个图神经网络去进行信息之间的连接推断
    在这里插入图片描述

  • N是代表neighbors

3.4 Pretraining and End-to-End Training

用contrastive learning paradigm(对比学习范式)去提高一个区域与其相关的其他区域
在这里插入图片描述

然后又是那个熟悉的式子,不过改了一点点,上面点乘改为了f函数说是可以自由更改。
在这里插入图片描述

采用了端到端的训练:
就是输入原始数据,然后得到最终结果
特性提取交给模型
如果对End-to-End Training 有问题可以看这篇:
如何理解深度学习中的端到端(End-to-end)概念_什么是深度学习端对端训练-CSDN博客

4. 实验对比

在这里插入图片描述

消融实验没什么好看的

这块:图的作用体现
在这里插入图片描述

  • 这里消息描述了高维图里权值的计算

小样本泛华能力也可以:
在这里插入图片描述

  • 8
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值