0、强大的哈工大的Ltp: Language Technology Platform (下载源代码)
http://ir.hit.edu.cn/ltp/
1.the Association for Computational Linguistics
网址:http://www.aclweb.org/
计算语言学协会网站,有大量文本资料,搜集整理了大量文本处理方面的软件。
2.GATE(General Architecture for Text Engineering)
网址:http://gate.ac.uk/
文本工程通用架构,由英国Sheffield大学自然语言处理组创建的一个开源软件,可用于多种文本处理任务,包括信息抽取。使用JAVA语言,基于MVC架构,与IBM的UIMA兼容。
在SourceForge网站有其资源网址http://sourceforge.net/projects/gate。
3.UIMA(Unstructured Information Management Architecture )
网址:http://domino.research.ibm.com/comm/research_projects.nsf/pages/uima.index.html
非结构信息管理架构,一个受到IBM支持的开源软件,使用JAVA开发的工业强度、大规模、可扩展的平台,用于创建、集成和部署结合语义分析和搜索组件的非结构化信息管理方案。
4.LDC About – About the Linguistic Data Consortium
http://www.ldc.upenn.edu/About/
The Linguistic Data Consortium is an open consortium of universities, companies and government research laboratories. It creates, collects and distributes speech and text databases, lexicons, and other resources for research and development purposes. The University of Pennsylvania is the LDC’s host institution.
5.哈尔滨工业大学信息检索研究室 – 搜索信息,理解语言,挖掘知识
http://ir.hit.edu.cn/
6.《知网》
http://www.keenage.com/
7.Cornell Natural Language Processing (NLP) Group, Cornell
http://www.cs.cornell.edu/Info/Projects/NLP/
8.thunlp – 清华大学自然语言处理组
http://nlp.csai.tsinghua.edu.cn/site/
9.CIC – 中国第一家网络口碑研究和咨询公司
http://www.cicdata.com/cn/index.php
10.数据挖掘研究院( China Data Mining Research ,ChinaKDD)
http://www.dmresearch.net/
11.中科院计算机所自然语言研究组
http://mtgroup.ict.ac.cn/
12.中文自然语言处理开放平台
http://www.nlp.org.cn/
13.北大计算语言所
http://icl.pku.edu.cn/
14. 斯坦福--The Stanford Natural Language Processing Group
http://nlp.stanford.edu
15、openNLP
http://incubator.apache.org/opennlp/
16、复旦NLP
http://jkx.fudan.edu.cn/nlp