以下信息均来自于lingpipe的说明页面:
http://alias-i.com/lingpipe/demos/tutorial/read-me.html
lingpipe的功能中对我们有帮助的有:
分类,聚类;实体识别,中文分词,情感分析;矩阵分解,条件随机场,EM算法,逻辑回归。
lingpipe有一个免费的软件包,版本为4.1.0。在下载之后会得到一个文件夹,在文件目录下我们会看到一个名为src的文件夹,lingpipe的全部功能基本就是在这个文件夹中的程序实现的。程序都是由java编写的,具体的用法可以参照上面的连接,简单得来说就是调取一些写好的函数就可以了,比较方便。下面,我以实体识别为例来将以下怎么用这个工具。
Algorithms 1:
importcom.aliasi.chunk.Chunker;
importcom.aliasi.chunk.Chunking;
importcom.aliasi.util.AbstractExternalizable;
importjava.io.File;
//以上是一些声明
public classRunChunker {
public static void main(String[] args)throws Exception {
File modelFile = new File(args[0]);