复述抽取生成doc03-实现01

  1. 编程实现01
  1. 定义一个句子类NewSentence,包含基本的句子,分词后的结果,以及句法分析树结果,以及句子中的锚点对象(命名实体)
  2. 分词采用IKAnalyzer
  3. 句法分析以及依存分析采用stanford parser(分析一个句子比较慢 加载汉语模型要1秒多)
  4. 结果如下:*

    句子“我计划出去旅行。”:
    Loading parser from serialized file models/chinesePCFG.ser.gz ... done [1.6 sec].
    (ROOT
    (IP
    (NP (PN 我))
    (VP (VV 计划)
    (IP
    (VP (VV 出去)
    (NP (NN 旅行)))))))
    Dependency : [nsubj(计划-2, 我-1), root(ROOT-0, 计划-2), ccomp(计划-2, 出去-3), dobj(出去-3, 旅行-4)]
    Name Entity : [我, 旅行]

    句子“曹雪芹写作了红楼梦。”:
    Loading parser from serialized file models/chinesePCFG.ser.gz ... done [1.5 sec].
    (ROOT
    (IP
    (NP (NR 曹雪芹))
    (VP (VV 写)
    (NP (NN 作了) (NN 红楼梦)))))
    Dependency : [nsubj(写-2, 曹雪芹-1), root(ROOT-0, 写-2), nn(红楼梦-4, 作了-3), dobj(写-2, 红楼梦-4)]
    Name Entity : [曹雪芹, 红楼梦]

    句子“毛泽东出生于1893年12月26日。”:
    Loading parser from serialized file models/chinesePCFG.ser.gz ... done [0.9 sec].
    (ROOT
    (IP
    (NP (NR 毛泽东))
    (VP (VV 出生于)
    (NP (NT 1893年) (NT 12月) (NT 26日)))))
    Dependency : [nsubj(出生于-2, 毛泽东-1), root(ROOT-0, 出生于-2), nn(26日-5, 1893年-3), nn(26日-5, 12月-4), dobj(出生于-2, 26日-5)]
    Name Entity : [毛泽东, 1893年12月26日]

    句子“曹雪芹写了红楼梦。”:
    Loading parser from serialized file models/chinesePCFG.ser.gz ... done [2.2 sec].
    (ROOT
    (FRAG (NR 曹雪芹) (NN 写了) (NR 红楼梦)))
    Dependency : [dep(写了-2, 曹雪芹-1), root(ROOT-0, 写了-2), dep(写了-2, 红楼梦-3)]
    Name Entity : []

  • # 暂时的版本,后续会进行相应的修改
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值