一个使用WordNet比较词语相似度的Java包——JWS(Java WordNet Similarity)

JWS是WordNet::Similarity(一个Perl版的WordNet相似度比较包)的Java实现版本,想用Java实现用WordNet比较词语相似度的朋友有福拉!!简述使用步骤:

1、下载WordNet(Win、2.1版):http://wordnet.princeton.edu/wordnet/download/

2、下载WordNet-InfoContent(2.1版):http://wn-similarity.sourceforge.net/ 或http://www.d.umn.edu/~tpederse/Data/

3、下载JWS(现有版本:beta.11.01):http://www.sussex.ac.uk/Users/drh21/

4、安装WordNet;

5、解压WordNet-InfoContent-2.1,并将文件夹拷贝至WordNet目录D:/Program Files/WordNet/2.1下;

6、将JWS中的两个jar包:edu.mit.jwi_2.1.4.jar和edu.sussex.nlp.jws.beta.11.jar拷贝至Java的lib目录下,并设置环境变量;

7、在Eclipse下运行JWS中的例子程序:TestExamples

     说明:由于下载的WordNet是2.1版本的,所以程序中有几处需要修改

     String dir = "C:/Program Files/WordNet";    //这里指定WordNet的安装路径,按照你实际安装的路径加以修改

     JWS ws = new JWS(dir, "3.0");                   //把3.0改为2.1即可

8、例子运行结果:

Loading modules
set up:
... finding noun and verb <roots>
... calculating IC <roots> ...
... ICFinder
... DepthFinder
... PathFinder
... JiangAndConrath
... Lin
... Resnik
... Path
... WuAndPalmer
... Adapted Lesk : all relations
... Adapted Lesk (1)
... Adapted Lesk (2)
... HirstAndStOnge
... LeacockAndChodorow
... calculating depths of <roots> ...


Java WordNet::Similarity using WordNet 2.1 : loaded

Jiang & Conrath

apple#n#1,banana#n#1 0.04658846107981151
apple#n#1,banana#n#2 0.13115409462626942
apple#n#2,banana#n#1 0.0
apple#n#2,banana#n#2 0.0

specific pair = 0.04658846107981151


highest score = 0.13115409462626942

Lin

apple#n#1,banana#n#1 0.11802556069890623
apple#n#1,banana#n#2 0.6867056880240358
apple#n#2,banana#n#1 0.0
apple#n#2,banana#n#2 0.0

specific pair = 0.11802556069890623


highest score = 0.6867056880240358


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值