UIMA自带资源的介绍

 

总结一下自己未来需要重点关注的插件/组件:

 

通用工具:

1. Regular Expression Annotator

可以使用其中的很多正则表达式

2. Dictionary Annotator

可以作为基本的标注工具

3. Hidden Markov Model Tagger Annotator

可以用来训练模型,并应用模型提供需要的服务

4. Lucene CAS indexer (Lucas)

未来肯定会用,是和其他项目的接口

5. Tika Annotator   

可以用来做指定数据的解析器,xml,pdf,html

 

项目相关:

1. Concept Mapper Annotator

可以用于概念,实例的表示。和小丘相关 

2. OpenCalais Annotator

这个东西其实是完全参考,用于发现概念之间的关系。OpenCalais背后的技术比这个解释器意义更大。

3. Configurable Feature Extractor Annotator

抽取信息是可以参考的一种方法,特别是在开放领域中抽取信息的时候

 

 

打包工具:

1. PEAR Packaging Maven Plugin

2. PEAR Packaging ANT Task

两者选一个就可以,具体哪一个可以用的时候再看


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值