斯坦福自然语言处理(1)——三元组的使用

最新推荐文章于 2024-08-02 23:26:24 发布

Rylynn_

最新推荐文章于 2024-08-02 23:26:24 发布

阅读量6k

点赞数

分类专栏：自然语言分析文章标签：自然语言处理

本文链接：https://blog.csdn.net/qq_34825926/article/details/64954518

版权

三元组是斯坦福自然语言解析中比较基础的一部分，主要过程是将每一个句子从文中提取出来以后，将句子中符合三元组（subject+relation+object）的成分提取出来，其中每个triple中有四个成员变量：
1、confidence：表示该三元组符合subject+relation+object程度的置信度
2、subject：三元组中的主体，表示动作的发出者
3、relation：三元组中表示subject和object的联系
4、object：三元组中表示relation动作的承受者

首先对工具入口StanfordCoreNLP进行实例化pipeline，并在管道中添加分析三元组所需要的功能，用Property类来实现。我这里定义了一个TripleBean类，每个三元组类中含有TripleSubject、TripleRelation、以及TripleObject、其中每个类中都包含该单词的词性、命名实体，以一个TripleElement作为例子

package edu.stu.common;

public class TripleElement {
private String element;
private String nameentity;
private String partofspeech;

public TripleElement(String element ,String nameentity ,String partofspeech)\\实例化一个TripleElement对象
{
    this.element = element;
    this.nameentity = nameentity;
    this.partofspeech = partofspeech;
}

public  String getElement()\\元素的单词本身
{