分词器之NLPIR加密文件在哪

NLPIR分词器对个人用户永久免费,适用于科研用途。当软件过期,需下载最新版本,替换Data/NLPIR.user加密文件以继续使用。此文件相当于软件证书。可以进行Python包装操作。
摘要由CSDN通过智能技术生成

官方网站 http://ictclas.nlpir.org/newsdownloads?DocId=389
既然官方承诺对个人用户永久免费,那拿来做科研还是可以的。只不过每次过期失效之后都要下载最新版本,找到其中的Data/NLPIR.user文件, 这是一个加密文件, 相当于软件可以用的证书。
替换旧版本的Data/NLPIR.user文件,其他不变即可继续使用很长时间了。

python包装之后的代码:

# -*- coding: UTF-8 -*-
__author__ = 'Peter_Howe<haobibo@gmail.com>'

'''
Python Warpper for ICTCLAS2014
Loading functions from Dynamic Link Library  directly.
'''
from ctypes import *

#NLPIR2014 Lib File (NLPIR64, NLPIR32, libNLPIR64.so, libNLPIR32.so),
#Change this when you are not using a Win64 environment:
libFile = './nlpir/NLPIR32.dll'

dll =  CDLL(libFile)
#load函数,进行dll的python包装
def loadFun(exportName, restype, argtypes):
    global dll
    f = getattr(dll,exportName)
    f.restype = restype
    f.argtypes = argtypes
    return f

class ENCODING:
    GBK_CODE        =   0               #默认支持GBK编码
    UTF8_CODE       =   GBK_CODE+1      #UTF8编码
    BIG5_CODE       =   GBK_CODE+2      #BIG5编码
    GBK_FANTI_CODE  =   GBK_CODE+3      #GBK编码,里面包含繁体字

class POSMap:
    ICT_POS_MAP_SECOND  = 0 #计算所二级标注集
    ICT_POS_MAP_FIRST   = 1 #计算所一级标注集
    PKU_POS_MAP_SECOND  = 2 #北大二级标注集
    PKU_POS_MAP_FIRST   = 3 #北大一级标注集

POS = {
    "n": {  #1. 名词  (1个一类,7个二类,5个三类)
        "n":"名词",
        "nr":"人名",
        "nr1":"汉语姓氏",
        "nr2":"汉语名字",
        "nrj":"日语人名",
        "nrf":"音译人名",
        "ns":"地名",
        "nsf":"音译地名",
        "nt":"机构团体名",
        "nz":"其它专名",
        "nl":"名词性惯用语",
        "ng":"名词性语素"
    },
    "t": {  #2. 时间词(1个一类,1个二类)
        "t":"时间词",
        "tg":"时间词性语素"
    },
    "s": {  #3. 处所词(1个一类)
        "s":"处所词"
    },
    "f": {  #4. 方位词(1个一类)
        
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值