我正在寻找一个Java实现的广义后缀树(GST),具有以下特点:
在使用say 1000字符串创建GST之后,我想知道这1000个字符串中有多少包含其他字符串"s"。
搜索必须安静快速,因为我需要将搜索应用于大约10万个平均长度为10的候选字符串。
嗨,我想知道你能告诉我你最后用了哪种溶液,我也有同样的问题!!!!
看这里:stackoverflow.com/questions/9452701/…
尝试语义发现工具包。它在T/SRC/Java/ORG/SD/TEX/RexxTead上实现
呃,你知道任何实现(甚至教程!)对于令牌后缀树?
我在Java中创建了一个后缀树,允许您轻松添加自己的搜索功能和其他匹配算法。我的博客文章,后缀树在Java中,有一个概述,以及下载最新版本的说明。我的Java实现是基于Mark Nelson的快速字符串搜索后缀树文章。
2016-06-18更新
包含上述后缀树实现的库现在可以在https://bitback.org/globalmentor/globalmentor-core上找到。
该库的最新版本可从Maven Central获得,网址为http://search.maven.org/search%7cga%7c1%7cg%3a%22com.globalmentor%22%20和%20a%3a%22globalmentor core%22。
该博客文章提供了大量信息,但目前还没有提供来源(2015年8月),因为它指向了受密码保护的svn.globalmentor.com/java/trunk/globalmentor-core。
我正在尽我最大的努力将我们的存储库从Subversion转换为Git并再次公开。这应该在一两周内发生。如果到那时还没有,请随时打电话给我。干杯。
源代码现在可以通过Git和Maven Central获得。我已经用新地点更新了上面的答案。
有一个非通用后缀树的Java实现可在:HTTP:/ILYA KEEPLLIN .BLGSPOT.COM/200 9/04/EXIX-TIEES-JAVA UKONSCNEN算法.HTML
如果它是MarkNelson的直接端口,那么它不是一个通用后缀树。它只是一个后缀树。
对,我改写了我的答案。谢谢。
您可以在Java中找到一个通用后缀树的实现。我尽量把它记录下来,这样你会发现它很有用。
以下是我对suffixtree的实现:https://github.com/losvald/sglj/blob/master/src/main/java/org/sglj/util/pattrie.java
此外,它还支持在节点中存储任意数据,并查找与前缀关联的一组值。