准备用1个月(发现1个月的时间根本不够啊!!!)的时间仔细研究一下信息抽取,对应的代码则是学习TPlinker。
总结
1. 问题
1.1 为什么在.py 文件中,还可以有jupyter 中的cell出现?
1.2 我在将TPlinker-joint-extraction-master
替换成 TPlinker_master
的时候,再执行tplinker
下的train.py
时,就发现报Common
包无法导入的问题。
原因就是,在代码根目录下执行python intall -e .
时就会把这个包所在的路径名写到系统的环境变量中,即/home/lawson/program/TPlinker-joint-extraction-master
作为python的系统环境变量已经写入了,所以导入其目录下的包Common
时就可以,但是如果重命名之后,因为不在系统环境变量中,所以执行失败。
1.3
train_data 中的数据:
train_data 是一个list,里面装的是dict。dict 的内容如下:
详细的说一下,这里面的每个键值对的含义。
text:是原文本;
id:表示训练数据的条数
relation_list: 表示当前这条文本中存在什么样的关系
entity_list :表示当前这串文本中有哪些entity