最大熵模型maxent及icwb2-data评估用法

这篇博客介绍了如何在命令行环境下利用最大熵模型(maxent)进行中文韵律词的停顿边界预测,并详细阐述了如何使用icwb2-data工具包对预测结果进行评估,包括工具包的下载、安装步骤和命令行运行方法。
摘要由CSDN通过智能技术生成

利用maxent\icwb2-data 进行中文韵律词的停顿边界预测

1.在命令行下用最大熵进行韵律预测

利用张乐博士的最大熵工具包进行预测

[http://http://homepages.inf.ed.ac.uk/lzhang10/maxent_toolkit.html#intro](http://http://homepages.inf.ed.ac.uk/lzhang10/maxent_toolkit.html#intro "工具包下载网址")

//训练语料生成model文件
maxent -m Modelname -i 30 -v maxtrain.txt >2.txt
//预测结果
maxent -p -m Modelname -o maxoutput.txt maxtest.txt
//利用命令--detail生成每一条的N\Y的正确率
maxent -p -m Modelname --detail -o maxoutput.txt maxtest.txt >maxent_accuracy.txt
//可以用
maxent-h 查看帮助文档

2.利用icwb2-data工具包对预测结果进行评估

2.1 工具包下载地址

http://http://sighan.cs.uchicago.edu/bakeoff2005/

【用法】

因为该工具包是在linux下执行的,若想在windows命令行下进行预测,则需要安装一些软件.

首先:安装ActivePerl能识别后缀名为.pl的文件。这个从晚上就可以百度得到。

其次:安装diffUtil工具包。
http://http://gnuwin32.sourceforge.net/packages/diffutils.htm

直接下载安装包,不要下载bin包了,也就是steup格式的。

还需要下载两个动态链接库:libint3.dll、libiconv3.dll。这两个在diffUtil网址下直接下在安装包安装即可。

注意都要安装到同一个目录下面

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值