下面记录一下三元组抽取的步骤:
首先是人工标引三元组,然后依次执行以下步骤:
步骤一:从excel标引文件中生成json格式数据;去除头尾放入index_ann.json文件中,上传到ann_four_data目录下;
步骤二:运行 python sao.py 进行训练;
步骤三:从excel未标引文件中生成测试数据;去除头尾放入index_wait.csv文件中,上传到wait_ann_four_data目录下;
步骤四:运行 python sao.py 进行三元组抽取;
步骤五:运行processcsv.java文件,处理index_wait_label.csv文件,生成三元组。
表:三元组标引示例
专利文档 | subject | action | objection |
The graphene capacitor has high conductivity | graphene capacitor | has | high conductivity |