lingpipe中文分词模块测试Demo的参数设置

lingpipe的测试Demo中的参数如下所示

 mZipFile = new File(args[0],"icwb2-data.zip");

        mCorpusName =args[1];

        mOutputFile = new File(mCorpusName + ".segments");

        mKnownToksFile = new File(mCorpusName + ".knownWords");

        mMaxNGram = Integer.valueOf(args[2]);

        mLambdaFactor = Double.valueOf(args[3]);

        mNumChars = Integer.valueOf(args[4]);

        mMaxNBest = Integer.valueOf(args[5]);

将参数作如下修改,使代码运行

mZipFile = new File("D:/..../...../lingpipe-4.1.0/demos/tutorial/chineseTokens/icwb2-data.zip");
        mCorpusName = "pku";
        mOutputFile = new File("D:/../.../lingpipe-4.1.0/demos/tutorial/chineseTokens/msr_test_output" + ".segments");
        mKnownToksFile = new File(mCorpusName + ".knownWords");
        mMaxNGram = 5;
        mLambdaFactor = 5.0;
        mNumChars = 4000;

        mMaxNBest = 128;

s上面参数的第一个路径名的压缩文件无需解压。第二个语料名字可以根据需要修改,输出路径也可以修改,剩下的几个是自己自定义的。不知道具体的范围是多少。但是程序可以跑起来输出结果了。




======================================================



Demo里面还有一个CHineseTokener的测试程序,参数修改方式也差不多。



    Data Directory=e:\..\...
    Train Corpus Name=msr
    Test Corpus Name=pku
    Output File Name=E:\..
    Known Tokens File Name=E:\..\..
    Char Encoding=Big5_HKSCS
    Max N-gram=5
    Lambda factor=5.0
    Num chars=3000
    Max n-best=128
    Continue weight=0.0
    Break weight=0.0



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值