自然语言处理NLP开源软件工具包

最新推荐文章于 2024-07-24 08:46:20 发布

王哲晓

最新推荐文章于 2024-07-24 08:46:20 发布

阅读量9.4k

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qushaming/article/details/92585334

版权

本文介绍了十个自然语言处理（NLP）的开源软件工具，包括NLTK、OpenNLP、LTP、Stanford CoreNLP、Gensim、spaCy、FudanNLP、NLPIR、THULAC和HanLP。这些工具提供了中文分词、词性标注、命名实体识别、依存分析等丰富功能，广泛应用于文本处理、信息抽取、情感分析等领域。

摘要由CSDN通过智能技术生成

自然语言处理（NLP）开源软件工具包

基础研究领域
1、文本分类
2、依存分析
3、命名实体
4、词性标注
5、中文分词
6、情感分析
7、信息抽取
8、文本摘要

一、NLTK

NLTLK官方文档地址：http://www.nltk.org/

原文地址：http://www.52nlp.cn/tag/nltk-book

NLTK（Natural Language Toolkit）是最为知名的Python自然语言处理工具，是宾夕法尼亚大学计算机与信息科学系在2001年开发的基于Apache协议的开源软件。NLTK 提供包括WordNet在内的百余个语料资源，以及分类、分词、词干提取、词性标注、依存分析、语义推断等一系列功能，并维护了一个活跃的开发者论坛。除了免费、开源、社区驱动等特性之外，NLTK还提供了简易的上手教程和丰富的开发文档，在众多国家的大学课程中作为教学工具广泛使用。

二、OpenNLP

OpenNLP是基于机器学习的Java自然语言处理工具包，是Apache Software Foundation在2010年开发的基于Apache 2.0协议的开源软件。OpenNLP提供基于机器学习的自然语言文本处理功能，包括标记化、浅层分析&#x

最低0.47元/天解锁文章

关注

3
点赞
踩
47

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

王哲晓 CSDN认证博客专家 CSDN认证企业博客

码龄9年

94: 原创

17万+: 周排名

4万+: 总排名

98万+: 访问

: 等级

5190: 积分

176: 粉丝

456: 获赞

92: 评论

1424: 收藏

私信

关注

热门文章

分类专栏

Soft install 2篇
Redis 1篇
Git
设计模式 4篇
MySQL 9篇
Java 22篇
Linux 9篇
架构 5篇
面试 5篇
Mybatis 2篇
ElasticSearch 5篇
Jenkins
Docker
JVM 1篇
Logback 1篇
IDEA 2篇
SpringBoot 6篇
Spring 15篇
RabbitMQ 2篇
Spring Cloud 1篇
Maven 7篇
程序人生 5篇
数据结构 3篇
算法 1篇
Dubbo 1篇

最新评论

第四章单例模式
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加除了各种控件外，文章正文的字数。
Java开发工程师面试题（Spring）
一个双鱼座的测开: 博主写的非常清晰啊，对我很有帮助谢谢啦!欢迎作者闲暇之余能回关我的博客进行指导，谢谢！
Linux 无法启动网络(service network restart) 错误解决办法
沃码: 这啥宝问题，搞了这种办法都没用，试了第三种方法马上就好了
ElasticSearch使用completion实现补全功能
UncoDong: 版本问题。7.8版本下，修改成 [code=json] "mappings": { "properties": { "keyword": { "type": "completion", "analyzer": "ik_pinyin_analyzer", "fields": { "key": { "type": "keyword" } } }, "id": { "type": "keyword" }, "createDate": { "type": "date", "format": "yyyy-MM-dd HH:mm:ss" } } } [/code]
ElasticSearch使用completion实现补全功能
UncoDong: 感谢博主的文章。补充一下，在ES 7.8下，相关参数需要进行以下修改 [code=json] PUT suggest { "mappings": { "properties": { "keyword": { "type": "completion", "analyzer": "ik_pinyin_analyzer", "fields": { "key": { "type": "keyword" } } }, "id": { "type": "keyword" }, "createDate": { "type": "date", "format": "yyyy-MM-dd HH:mm:ss" } } } } POST _bulk?refresh=true { "index": { "_index": "suggest", "_type": "_doc" }} { "keyword": "项目"} { "index": { "_index": "suggest", "_type": "_doc" }} { "keyword": "项目进度"} { "index": { "_index": "suggest", "_type": "_doc" }} { "keyword": "项目管理"} { "index": { "_index": "suggest", "_type": "_doc" }} { "keyword": "项目进度及调整汇总.doc_文档"} { "index": { "_index": "suggest", "_type": "_doc" }} { "keyword": "项目"} [/code]

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。