Embedding
-嵌入一词该作何解
本文是本菜鸟在阅读了三篇网络嵌入论文后的胡思乱想,不喜勿喷但欢迎理性讨论
今日在看network-embedding
,就是将一张图G
中的节点转化为向量的形式,以方便将图G
所含信息传入其他模型训练。
例如,
G = (V,E),V = {1,2,3,4,5},E = {(1,2),(2,3),(3,5)}
可以将节点1转化为向量 v 1 = ( 0 , 0.1 , 1 ) v1 = (0,0.1,1) v1=(0,0.1,1),将节点2转化为向量 v 2 = ( 0 , 0.2 , 0.9 ) v2=(0,0.2,0.9) v2=(0,0.2,0.9),节点4转化为向量 v 3 = ( 1 , 1 , 0 ) v3=(1,1,0) v3=(1,1,0)可以看到,向量$ v1 与 v2 之 间 的 余 弦 距 离 很 近 , 而 之间的余弦距离很近,而 之间的余弦距离很近,而v1与v3$之间的余弦距离较远,这就体现了节点1与节点2之间的相连关系,而节点1与节点3没有链接。
当图很大时,这一技巧很有用。如果一个图G
有n
个节点,那么就可能有n^2
条边,想要将其作为训练数据会很困难。
但是使用网络嵌入就可以将每个节点转化为低维度的向量,例如10维。
啰嗦一堆,要说主要部分了,将节点转化为向量为啥要叫做Emdedding
?这和嵌入有啥关系,真是摸不着头脑。
于是我查阅了embed
一词的含义发现:
embed
一词有5作为本质特征体现的语义,
网络嵌入network-embedding
,将节点转化为向量,可能就是在挖掘节点的本质特征(语义、属性等性质上的相似性转化为向量空间上的相似性)。
于是杠精我得出结论,网络嵌入,词嵌入中的embedding
在英语语境下是学习这些内容的内在或本质特征,而直接粗暴的翻译为嵌入二字,缺失了这种语境。
信、雅、达呢?我们工科生有志于翻译的还需有点文学素养啊。
结尾吐槽:
最近还有一个更垃圾的翻译:鲁棒性。
神他妈鲁棒。