polyglot:Pipeline 多语言NLP工具

在这里插入图片描述

公众号 系统之神与我同在

http://link.zhihu.com/?target=https%3A//cloud.tencent.com/developer/article/1519291

目前,在NLP任务处理中,Python支持英文处理的开源包有NLTK、Scapy、StanfordCoreNLP、GATE、OPenNLP,支持中文处理的开源工具包有Jieba、ICTCLAS、THU LAC、HIT LTP,但是这些工具大部分仅对特定类型的语言提供支持。本文将介绍功能强大的支持Pipeline方式的多语言处理Python工具包:polyglot。该项目最早是由AboSamoor在2015年3月16日在GitHub上开源的项目,已经在Github收集star 1021个。

Free software: GPLv3 license
Documentation: http://polyglot.readthedocs.org
GitHub: https://github.com/aboSamoor/polyglot

特征

·语言检测 Language Detection (支持196种语言)
·分句、分词 Tokenization (支持165种语言)
·实体识别 Named Entity Recognition (支持40种语言)
·词性标注 Part of Speech Tagging(支持16种语言)
·情感分析 Sentiment(支持136种语言)
·词嵌入 Word Embeddings(支持137种语言)
·翻译 Transliteration(支持69种语言)
·管道 Pipelines

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值