2021SC@SDUSC
本文章将对 vectorize.py中的代码部分内容进一步分析。重点在于对如何生成矩阵的代码分析
代码Link:https://github.com/rikdz/GraphWriter
def vec_ents(self,ex,field):
# returns tensor and lens
ex = [[field.stoi[x] if x in field.stoi else 0 for x in y.strip().split(" ")] for y in ex.split(";")]
return self.pad_list(ex,1)
定义了一个vec_ents函数,实现一种映射关系:当变量存在于变量池中,将该坐标对应的变量池中的数据值赋值给ex,若不存在,则赋值为零,并用;分割,存储于pad_list中,相当于创建了一个三元组,分别用“ ”和;分词。(返回张量和透镜)
def mkGraphs(self,r,ent):
#convert triples to entlist with adj and rel matrices
pieces = r.strip().split(';')
x = [[int(y) for y in z.strip().split()] for z in pieces]
rel = [2]
#global root node
adjsize = ent+1+(2*len(x))
adj = torch.zeros(adjsize,adjsize)
for i in range(ent):
#adj[i,0]=1
adj[ent+1,i]=1
for i in range(adjsize):
adj[i,i]=1
for y in x:
rel.extend([y[1]+3,y[1]+3+self.REL.size])
a = y[0]
b = y[2]
c = ent+len(rel)-2
d = ent+len(rel)-1
adj[a,c] = 1
adj[c,b] = 1
adj[b,d] = 1
adj[d,a] = 1
rel = torch.LongTensor(rel)
return (adj,rel)
该函数mkGraph的主要功能是将上面函数创建的三元组转化为矩阵,即entlist与adj和rel矩阵。
pieces = r.strip().split(';')
x = [[int(y) for y in z.strip().split()] for z in pieces]
rel = [2]
首先,该函数对局部变量进行定义,pieces为以;分割的维度,x为分为pieces(降维)后的横坐标,rel是一个列表(仅含2)
#global root node
adjsize = ent+1+(2*len(x))
adj = torch.zeros(adjsize,adjsize)
对全部节点进行定义,adjsize计算出矩阵的大小,torch.zeros函数全例为torch.zeros(*size, out=None, dtype=None, layout=torch.strided, device=None, requires_grad=False) -> Tensor
返回一个全为标量 0 的张量,形状由可变参数 *size 定义。该返回结果为一个行列数目均为adjsize的全0矩阵。
for i in range(ent):
#adj[i,0]=1
adj[ent+1,i]=1
for i in range(adjsize):
adj[i,i]=1
将adj矩阵中横坐标为ent+1位置的所有数据变为1,再对adj矩阵中对角线上的所有数据变为1.
for y in x:
rel.extend([y[1]+3,y[1]+3+self.REL.size])
a = y[0]
b = y[2]
c = ent+len(rel)-2
d = ent+len(rel)-1
adj[a,c] = 1
adj[c,b] = 1
adj[b,d] = 1
adj[d,a] = 1
遍历每个降维后的单个列表,再rel中添加新的列表[y[1]+3,y[1]+3+self.REL.size],且对0和2位置进行初始化,得到a ,b,同时c,d是第三维初始值,将adj矩阵剩余无实值部分填充为1.
rel = torch.LongTensor(rel)
return (adj,rel)
torch.LongTensor() 会调用Tensor类的构造函数__init__,生成64位整型类型的张量。 然后返回计算出的adj和rel矩阵张量。