ICTCLAS函数说明

1.publicnative boolean ICTCLAS_Init(byte[] sPath);

参数:

sPath:最初的目录路径, Configure.xml 和Data 的存储路径

注意:ICTCLAS_Init()必须在ICTCLAS去其他操作之前调用

 

2.publicnative boolean ICTCLAS_Exit();

退出程序,释放所有资源和缓冲区

 

3.publicnative int ICTCLAS_ImportUserDictFile(byte[] sPath,int eCodeType);

导入用户自定义的数据字典,返回导入词条的数量,

参数:

sPath为用户字典的文件名

eCodeType为编码方式

 

4.publicnative int ICTCLAS_SaveTheUsrDic();

保存用户词典

1.本接口将会覆盖原有/data/文件夹用户相关词典。

2.用户可在配置文件中,指定下次是否使用该词典。

 

5.publicnative int ICTCLAS_SetPOSmap(int nPOSmap);

指定词性标注集

nPOSmap :

ICT_POS_MAP_FIRST  //计算所一级标注集

ICT_POS_MAP_SECOND //计算所二级标注集

PKU_POS_MAP_SECOND // 北大二级标注集                                       

PKU_POS_MAP_FIRST  // 北大一级标注集

 

6.publicnative boolean ICTCLAS_FileProcess(byte[] sSrcFilename,int eCodeType, int bPOSTagged,byte[] sDestFilename);

处理文本文件

sSourceFilename:源文件路径

eCodeType:源文件的字符编码类型

bPOStagged:判断是否需要词性标注,0为不标记,1为标记,默认情况下:1。

sDsnFilename:存储结果的文件名。

 

7.publicnative byte[] ICTCLAS_ParagraphProcess(byte[] sSrc, int eCodeType, intbPOSTagged);

处理一个段落,并返回结果缓冲区指针

SSRC:源段

eCodeType:字符串的字符编码类型

bPOStagged:判断是否需要词性标注,0为不标记,1为标记,默认情况下:1。

 

 

8.publicnative byte[] nativeProcAPara(byte[] sSrc, int eCodeType, int bPOStagged);

 分词,返回ICTCLAS_Result类对象对应的字节序列,需要按照一定的规则将其进行编码

将分词结果转化为stResult结构体输出


参数:

SSRC:源段落

eCodeType:资源的字符类型

bPOStagged:判断是否需要词性标注,0为不标记,1为标记,默认情况下:1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值