中科院分词pynlpir使用说明（翻译）

最新推荐文章于 2021-02-18 19:36:09 发布

飞霖雨

最新推荐文章于 2021-02-18 19:36:09 发布

阅读量7.1k

点赞数 7

分类专栏： NLP

本文链接：https://blog.csdn.net/qq_34130509/article/details/89518037

版权

今天用jieba分词分中英混合的句子时效果不太好，就寻求其他分词库，找到了中科院分词pynlpir，不过没找到比较新的，中文的使用说明，这里对照github上的英文说明做一个简要的介绍。

安装

在cmd里输入对应语句即可：

pip install pynlpir

需要说明的是，安装完成后，使用模块时提示我license有问题，需要更新一下，所以需要继续在cmd里输入：

pynlpir update

Pynlpir辅助函数

引入

引入模块很简单：

import pynlpir

打开数据文件并初始化API

使用open()方法打开数据文件并出示话API，需要注意的是，该方法默认输入文件的编码格式为Unicode或者UTF-8格式，如果要使用'GBK'或者'BIG5'编码格式，需要更改对应参数。

pynlpir.open() 

pynlpir.open(encoding = 'big5') #编码格式不是Unicode和UTF-9

分割文本

举个粟子：

s = 'NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统，从2009年开始，为了和以前工作进行大的区隔，并推广NLP

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

飞霖雨

关注关注

7
点赞
踩
27

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

中科院分词pynlpir使用说明续（翻译）

qq_34130509的博客

04-26

2825

今天继续来写pynlpir分词库的后续pynlpir.nlpir(以下简称nlpir)。nlpir比pynlpir的功能相似，更易于使用，下面开始介绍。初始化 pynlpir.nlpir.Init(data_dir, encoding=GBK_CODE, license_code=None) 使用Init方法初始化函数。 data_dir（str） - NLPIR数据文件夹的父文件夹的...

pynlpir(ICTCLAS)初步使用

微电子学与固体电子学-俞驰

08-21

1848

# -*- coding:utf-8 -*- import pynlpir # 引入依赖包 pynlpir.open() # 打开分词器 # s = 'NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统，从2009年开始，为了和以前工作进行大的区隔，并推广NLPIR自然语言处理与信息检索共享平台，调整命名为NLPIR分词系统。' # 实验文本 s='我想听刘德华的笨小孩' p

4 条评论您还未登录，请先登录后发表或查看评论

python pynlpir中科院分词的使用

红目香薰

02-18

3584

中科院汉语分词系统是一个非常好用的分词工具，和结巴分词类似，但是比结巴分词功能更加强大，而且更加个性化。 中科院分词的使用步骤如下：导入中科院分词模块初始化pynlpir分词库。在pynlpir库中提供了open()函数用来初始化pynlpir分词库 1、需要下载【pynlpir】库 2、【open()】函数介绍： open()函数的原型如下： pynlpir.open(data_dir=pynlpir.nlpir.PACKAGE_DIR, encoding=pynlpir.ENCOD

windows7 32位环境下pynlpir的安装与使用

网络笔记

09-14

2328

windows7 32位环境下pynlpir的安装与使用 http://blog.sina.com.cn/s/blog_664f17ce0102w4h8.html pynlpir是一个针对中科院分词器NLPIR/ICTCLAS而开发的一个python包，只能在python2.7或3上运行。仅能在Windows or GNU/Linux环境中运行。一、pynlpir的

中科院中文分词系统－－字典结构

surpaimb的专栏

06-20

4146

中科院中文分词系统－－字典结构中科院中文分词系统（以下称：分词系统）一个很关键的部分就是他的字典，搞清楚字典的结构对我们进一步研究分词系统有很大的帮助。在这套分词系统中，有两种结构的字典，一种是保存常用词的词典，一种是保存字之间上下文关系的词典。这节分析的是第一种。这节分析的是第二种

利用Python中文分词组件Jieba实现中文分词利用Python中文分词组件Pynlpir实现中文分词利用Python中文分词组件Pyhanlp实现中文分词利用Python中文分词组件Pyltp实现中文分词

热门推荐

shuihupo的博客

08-09

3万+

#!/ Mypython # -*- coding: utf-8 -*- # @Time : 2018/8/5 22:19 # @Author : LinYimeng # @File : fenci_ceshi.py # @Software: PyCharm import time testCases=[&amp;amp;amp;amp;amp;amp;amp;amp;amp;quot;结婚的和尚未结婚的确实在干扰分词啊&amp;a

安利：pynlpir, nlpir 的python端接口, 通过python 使用nlpir / ictclas 2015

再见。

12-23

7095

最近准备一些文本处理的东西，发现还有很多朋友纠结于nlpir (ictclas 2015) python 接口，想起13年的时候通过python调用nlpir确实有些蛋疼，虽然网上教程很多，但几乎没几个系统使用的， GITHUB上，国际友人@tsroten 提供了nlpir 的python接口包， pynlpir 安装使用也非常简单如果有pip 的话，直接 pip

10-24

中文分词词库

11-22

中文分词词库

最新中文分词工具的词库

08-09

NLPIR 汉语分词系统 (PyNLPIR) 学习手札

MebiuW的专栏

08-17

2万+

1 关于NLPIR最近在做一些NLP相关的任务，其中一个关键的子任务就是如何对汉语进行分词？关于分词的方式，有很多很多，也是很多学习者的练手任务（比如我们当时的期末作业就有这个）。但是，轮子还是要搬来用，自己写的分词只能说是去了解这个方式（了解某个算法），做出来的都是能看不能用，毕竟模型、算法、语料库等一座座大山等着我们攻克。所以，我找了一些资料，看到一个不错的教程，他用了NLPIR，所以我也跟着使

PyNLPIR简介和下载安装

Junkichan的博客

07-14

4764

1、简介：PyNLPIR中文分词软件的python包。 2、下载地址：https://pypi.python.org/pypi/PyNLPIR/0.4.1#downloads 下载PyNLPIR-0.4.1.tar.gz (md5)压缩包 3、安装：将下载的压缩包解压缩，得到一个文件夹PyNLPIR-0.4.1，安装完成

python nlpir_nlp Python库之pynlpir

weixin_39928768的博客

12-17

247

项目需要，需要分词外加情感分析，网上的很多直接用的情感分析不适合本项目，因此需要修改情感词典从而加以修正。本次使用的就是pynlpir进行分词，然后情感分析逻辑自己搞。先跑几个小demo，可以试一试效果相关简短介绍：NLPIR分詞系統前身為2000年發布的ICTCLAS詞法分析系統，從2009年開始，為了和以前工作進行大的區隔，並推廣NLPIR自然語言處理與信息檢索共享平臺，調整命名為NLPIR分...

pynlpir中文分词+加载用户自定义词典

GreatXiang888的博客

12-29

3953

官方链接：https://github.com/tsroten/pynlpir [我是py3] 安装 1，pip install pip install pynlpir 2，更新 license （否则可能会报错） pynlpir update 简单使用 import pynlpir pynlpir.open() s = '欢迎科研人员、技术工程师、企事业单位与个人参与NLPIR平台的建设工...

Ubuntu ——Python下pynlpir安装以及首次使用时出现的license过期问题解决办法

weixin_41598638的博客

03-19

1719

首先，说明一下，如何安装，用pip灰常方便哦！输入以下命令即可$ pip install pynlpir如果权限不够，可以加入sudo pip install pynlpir验证是否安装成功，可以在shell中输入import pynlpir，当然也可以输入conda list查看（限安装了anaconda的用户），也可输入 pip list查看是否安装成功。接下来，我们就可以愉快的使用nlpir...

针对中科院java接口的使用方法和问题

qq_30232405的博客

04-09

1542

1.下载附加的中科院分词工具包（要下载的到我的博客里面免费下载即可） 2.解压后会看到如下几个文件夹 3.把java工程导入eclipse中，点击import，再选择existing project into workspace 4.导入sample文件下的JnaTest_NLPIR的java工程文件，按确定即可导入 5.在NlpirTest类下修改路径问题：

如何使用 中科院的分词工具

07-08

要使用中科院的分词工具，首先需要下载并安装该工具。你可以在中科院计算所的官方网站或相关的开源代码仓库中找到该工具的下载链接和安装说明。一般来说，安装过程可能涉及以下几个步骤： 1. 下载分词工具的压缩包，并解压到指定目录。 2. 配置环境变量，将分词工具的路径添加到系统的 PATH 变量中，以便在命令行中直接使用工具。 3. 根据分词工具的文档和示例，编写代码来调用分词工具。具体使用方法可能因分词工具版本和平台而有所不同，建议查阅相关文档或参考示例代码以了解更详细的使用方式。一般而言，你可以将待分词的文本作为输入，调用相应的函数或命令来进行分词处理，然后获取分词结果作为输出。可以根据需要选择不同的参数设置，例如是否启用词性标注、是否使用用户自定义词典等。需要注意的是，中科院的分词工具可能需要加载一些预训练模型和数据文件，所以在使用之前可能需要进行一些额外的初始化操作。确保按照官方文档提供的指南正确设置和初始化分词工具。