-
命名实体识别
-
词性标注
-
依赖解析
-
句子切分
-
文字分类
-
词形还原
-
形态分析
-
实体链接
正如 spaCy 背后的团队自己所说的那样,它创造了一个很棒的生态系统。在此处阅读有关其快速执行功能的更多信息。
PyNLPl
用于 NLP 的 PyNPl Python 库包含用于标准和不太常见的 NLP 任务的模块。它的用例范围从基本功能(如提取 n-gram 和频率列表)到构建简单的语言模型。此外,PyNPl 附带了一个用于处理 FoLiA XML 的完整库。
适用于 Python 2.7 和 Python 3。在此处查找有关常用函数、数据类型、实验、格式、语言模型、搜索算法等的深入信息。
Stanford CoreNLP
虽然 CoreNLP 是用 Java 编写的,但它为 Python 提供了 一个编程接口。 它使用户能够为文本导出语言注释—包括标记、句子边界、名称实体、数字和时间值、词性、共指、情感和引用属性。
它整合了Stanford的 NLP 工具,包括:
-
情绪分析
-
词性标注器
-
自举模式学习
-
解析器
-
命名实体识别器
-
会议决议系统
它的功能包括情感分析、解析、n-gram 和 WordNet 集成等。Stanford CoreNLP 适用于 macOS、Windows 和 Linux。
支持六种语言,是Java自然语言处理的一站式目的地。在此处阅读有关其功能的更多信息。