首先说一下句子相似度分析的主要思想。句法分析和义元分析是两个大方向,如果学过编译原理的大概能明白其中的关系。我做的方向就是句法分析这个方向的。
斯坦福句法分析器绝对不是最好用的中文句法分析器,它的主要思想都是以英语句法分析为前提的,因此在某些方面并不适合中文,但它一定是我们能找到的最好用的了。国内很奇怪,国外最好的东西都是开源的国内都是收费的。废话不说进入正题 (已经说了好多了)。
首先还是先要下载下来斯坦福句法分析器的压缩包,这个包比较大根本上传不上来,没有办法大家只能是自己下载了。斯坦福压缩包下载
下载下来之后就看到有四个jar,新建一个工程,右键选择最下面的一项properties。在左侧找到build path,把这四个都add进去,准备工作就好了。
下面的代码大家要一行不差复制,因为在压缩包中的例子有一点错误,不能直接使用。这些代码是我借用的别人的,我测试了没有问题。。
代码是我自己的,因为查重的关系不能直接给大家,只能是上传到资源了,大家去下载一下吧 斯坦福例子下载
我用的是3.4.1的版本jar,因此可能最新的有一些不同,差距不会太大,到时候大家可以留言问我。
到这里是无法使用的,因为获取到的是一句