SDP-LSTM语料中的实体和关系

import re
from nltk import tokenize


f=open(file='D:\\pythonProject1\\CNN\Relation-Classification-using-Bidirectional-LSTM-Tree-master\\data\\TRAIN_FILE.TXT')
lines=[]
for line in f:
    lines.append(line.strip())
relation=[]
for i,line in enumerate(lines):
    if (i-1)%4==0:
        relation.append(line)
text=[]
for i,line in enumerate(lines):
    if (i%4)==0:
        text.append(line)
print(text[:10])

f=open(file='关系.txt',mode='w')
for rel in relation:
    f.write(rel+'\n')

e1=[]
e2=[]
f = open(file='实体.txt', mode='w')
for i,line in enumerate(text):
    temp=[]
    t=line.split('<e1>')
    e1_t=t[1].split('</e1>')
    temp.append(e1_t[1])
    e1.append(e1_t[0])
    e2_t=e1_t[1].split('<e2>')
    e2_t2=e2_t[1].split('</e2>')
    e2.append(e2_t2[0])
    f.write('\n'+line)
    f.write('\t'+e1[i]+'\t')
    f.write(e2[i])
f.close()
print(f'文本的大小为:{len(text)},e1实体的数量是{len(e1)},e2实体的数量是{len(e2)}')
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YingJingh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值