斯坦福句法分析使用方法(java版)

首先说一下句子相似度分析的主要思想。句法分析和义元分析是两个大方向,如果学过编译原理的大概能明白其中的关系。我做的方向就是句法分析这个方向的。

斯坦福句法分析器绝对不是最好用的中文句法分析器,它的主要思想都是以英语句法分析为前提的,因此在某些方面并不适合中文,但它一定是我们能找到的最好用的了。国内很奇怪,国外最好的东西都是开源的国内都是收费的。废话不说进入正题 (已经说了好多了)。

首先还是先要下载下来斯坦福句法分析器的压缩包,这个包比较大根本上传不上来,没有办法大家只能是自己下载了。斯坦福压缩包下载

下载下来之后就看到有四个jar,新建一个工程,右键选择最下面的一项properties。在左侧找到build path,把这四个都add进去,准备工作就好了。

下面的代码大家要一行不差复制,因为在压缩包中的例子有一点错误,不能直接使用。这些代码是我借用的别人的,我测试了没有问题。。

代码是我自己的,因为查重的关系不能直接给大家,只能是上传到资源了,大家去下载一下吧 斯坦福例子下载

我用的是3.4.1的版本jar,因此可能最新的有一些不同,差距不会太大,到时候大家可以留言问我。

到这里是无法使用的,因为获取到的是一句关系

assmod(日报-3, 每天-1), assm(每天-1, 的-2), nsubj(记得-5, 日报-3), advmod(记得-5, 都-4), root(ROOT-0, 记得-5), rcomp(记得-5, 要-6), dobj(记得-5, 发送-7)

这玩意儿根本没法直接用,要用到后面的数据结构来存储,后面的东西我暂时不能上传,是我在做的核心内容,会在七月份更新,到时候会开源给大家(收一分,意思一下…………小无耻一下)

可以说一下思路,两个数字是一组,提取出来,存储到数据结构里面,然后的事情就是机密了。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值