关系抽取
正门大石狮
写可以复现的实验,写可以看懂的理论。
展开
-
【数据集分析】TACRED关系抽取数据集分析(四)—— train set 和 valid set中是否有重复数据
有些数据集和很不规范,train set和valid set 会有重复数据,造成数据的泄露,当然,TACRED应该不会有这个问题,因为它是关系抽取数据集中大家认可度很高的数据集合,这里分享一下分析的代码。原创 2020-07-09 11:54:53 · 1139 阅读 · 1 评论 -
【数据集分析】TACRED关系抽取数据集分析(三)—— Relation Distribution
第二节,获得了三个子集的描述:类别数和实例数。本节介绍绘制数据集的Relation分布图。原创 2020-07-09 11:48:01 · 1678 阅读 · 3 评论 -
【数据集分析】TACRED关系抽取数据集分析(二)—— 统计类别和实例数
第一节,我们查看了每条数据的组成,并将每条数据都规范了自己喜欢的Json格式,方便后续操作对数据的取用。本节统计一下数据集的关系数和实例数。原创 2020-07-09 11:44:41 · 2998 阅读 · 3 评论 -
【数据集分析】TACRED关系抽取数据集分析(一)—— 理解单条实例
最近拿到一个关系抽取数据集,[TACRED](https://nlp.stanford.edu/projects/tacred/),分析了一波单条数据、关系分布等,分享一下分析思路和代码。原创 2020-07-09 11:42:52 · 5307 阅读 · 24 评论