计算语言学概论/俞士汶主编.北京:商务印书馆,2003



 

 信息检索

 

 

 

信息提取

    一般而言,信息抽取系统进行的工作是这样一个计算机程序系统,这个系统的输入时非受限的文本,系统按照用户的预期,从文本中提取出用户预先指定的某些类型的信息。

实质上,信息抽取系统进行的工作是从非结构化的文本中提取结构化的信息。

 

    信息提取系统的应用价值在:(1)情报收集;(2)科技文献监控;(3)医疗保健服务;(4)商业信息提取。其中商业信息提取的应用中,可以专门设计一个信息提取系统,分析新闻中的商业信息,提取诸如有关公司合并、合并的参与方以及合并涉及金额等信息,提供决策支持信息。

 

    信息提取的具体任务:(1)准确识别文本中的各种命名实体,这一般包括文本中出现的人名、地名、机构名、时间表示、货币表示以及各种数字等等;(2)准确识别并标记指称相同的不同语言元素,这种指称相同的语言元素一般称为共指;(3)利用领域知识进行推理,在实体—实体之间,实体—事件之间建立关系。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值