知识图到文本的生成(三)

2021SC@SDUSC

本文章将对 vectorize.py中的代码部分内容进一步分析。重点在于对如何生成矩阵的代码分析

代码Link:https://github.com/rikdz/GraphWriter

def vec_ents(self,ex,field):
    # returns tensor and lens
    ex = [[field.stoi[x] if x in field.stoi else 0 for x in y.strip().split(" ")] for y in ex.split(";")]
    return self.pad_list(ex,1)

定义了一个vec_ents函数,实现一种映射关系:当变量存在于变量池中,将该坐标对应的变量池中的数据值赋值给ex,若不存在,则赋值为零,并用;分割,存储于pad_list中,相当于创建了一个三元组,分别用“ ”和;分词。(返回张量和透镜)

  def mkGraphs(self,r,ent):
    #convert triples to entlist with adj and rel matrices
    pieces = r.strip().split(';')
    x = [[int(y) for y in z.strip().split()] for z in pieces]
    rel = [2]
    #global root node
    adjsize = ent+1+(2*len(x))
    adj = torch.zeros(adjsize,adjsize)
    for i in range(ent):
      #adj[i,0]=1
      adj[ent+1,i]=1
    for i in range(adjsize):
      adj[i,i]=1
    for y in x:
      rel.extend([y[1]+3,y[1]+3+self.REL.size])
      a = y[0]
      b = y[2]
      c = ent+len(rel)-2
      d = ent+len(rel)-1
      adj[a,c] = 1 
      adj[c,b] = 1
      adj[b,d] = 1 
      adj[d,a] = 1
    rel = torch.LongTensor(rel)
    return (adj,rel)

该函数mkGraph的主要功能是将上面函数创建的三元组转化为矩阵,即entlist与adj和rel矩阵。

pieces = r.strip().split(';')
x = [[int(y) for y in z.strip().split()] for z in pieces]
rel = [2]

首先,该函数对局部变量进行定义,pieces为以;分割的维度,x为分为pieces(降维)后的横坐标,rel是一个列表(仅含2)

#global root node
    adjsize = ent+1+(2*len(x))
    adj = torch.zeros(adjsize,adjsize)

对全部节点进行定义,adjsize计算出矩阵的大小,torch.zeros函数全例为torch.zeros(*size, out=None, dtype=None, layout=torch.strided, device=None, requires_grad=False) -> Tensor
返回一个全为标量 0 的张量,形状由可变参数 *size 定义。该返回结果为一个行列数目均为adjsize的全0矩阵。

for i in range(ent):
      #adj[i,0]=1
      adj[ent+1,i]=1
for i in range(adjsize):
      adj[i,i]=1

将adj矩阵中横坐标为ent+1位置的所有数据变为1,再对adj矩阵中对角线上的所有数据变为1.

for y in x:
      rel.extend([y[1]+3,y[1]+3+self.REL.size])
      a = y[0]
      b = y[2]
      c = ent+len(rel)-2
      d = ent+len(rel)-1
      adj[a,c] = 1 
      adj[c,b] = 1
      adj[b,d] = 1 
      adj[d,a] = 1

 遍历每个降维后的单个列表,再rel中添加新的列表[y[1]+3,y[1]+3+self.REL.size],且对0和2位置进行初始化,得到a ,b,同时c,d是第三维初始值,将adj矩阵剩余无实值部分填充为1.

rel = torch.LongTensor(rel)

 return (adj,rel)

torch.LongTensor() 会调用Tensor类的构造函数__init__,生成64位整型类型的张量。 然后返回计算出的adj和rel矩阵张量。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值