lemur run PLSA

1.建索引

trec文档的最后一个</DOC>标记后一定要有换行。

建索引可以选用buildindex.exe,或者indribuildindex.exe。然后要说明的是,索引参数文件里有索引类型一项。<indexType> key(或indri)</indexType>。当用buildindex.exe时,建成的两种类型的索引文件是不一样的,甚至以后的概率表结果也有影响(但我不确定);而用indribuildindex.exe时,两种类型好像没啥区别。

2.训练三个概率表(train probability tables p_z.bin, p_z_d.bin, p_w_z.bin)

plsa的参数文件中,索引路径<index></index>,如果索引是indri类型的,则路径就是索引路径;如果是key类型的,则路径末尾要加上.key。

<doTrain></doTrain>是true。运行后的结果是产生三个二进制文件,分别是 p_z.bin, p_z_d.bin, p_w_z.bin。这三个文件的存储路径是相对路径,具体如何确定,我还不确定。

3.显示概率

只要把plsa参数文件中的<doTrain></doTrain>设为false,运行后即显示概率结果。

转载于:https://www.cnblogs.com/kevinGaoblog/archive/2012/06/08/2541761.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值