欧几里得数据
像图片(image) 和视频(video) 以及 语音(voice) 这些排列整齐的数据可以用矩阵来表达,如:
图片数据天然的,节点和邻居节点有着统计上的相关性,因此能够找出邻居节点。这类型的数据排列整齐,不同样本之间可以容易的定义出“距离”这个概念出来,意味着可以很容易地定义出卷积这个操作出来,并且在深度网络中进行进一步操作。假设现在有两个图片样本,尽管其图片大小可能不一致,但是总是可以通过空间下采样的方式将其统一到同一个尺寸的,然后直接逐个像素点进行相减后取得平方和,求得两个样本之间的欧几里德距离是完全可以进行的。如下式所见:
因此,不妨把图片样本的不同像素点看成是高维欧几里德空间中的某个维度,因此一张
m
×
n
m×n
m×n的图片可以看成是
m
×
n
m×n
m×n维的欧几里德样本空间中的一个点,而不同样本之间的距离就体现在了样本点之间的距离了。
同样的,视频可以在时间轴上进行采样做到统一的目的,而音频也是一样的。因此它们都是符合欧几里德距离定义的类型的样本。
非欧几里德数据
非欧几里德数据大致可以包括图(Graph)数据和流形数据,如下图所示:
图和流形数据排列不整齐,比较的随意,具体体现在:对于数据中的某个点,难以定义出其邻居节点出来,或者是不同节点的邻居节点的数量是不同的。难以在这类型的数据上定义出和图像等数据上相同的卷积操作,而且因为每个样本的节点排列可能都不同,因此难以定义出其欧几里德距离出来。这些数据不能看成是在欧几里德样本空间中的样本点,需要想办法将其嵌入(embeding)到合适的欧几里德空间后再进行度量。Graph Neural Network便可以进行这样的操作。