Brief Introduction to Suffix Array

转载 2012年05月28日 18:45:28

Brief Introduction to Suffix Array

Last Modified: 2000-11-14 (Since: 2000-11-14)


Suffix array is a data structure designed for efficient searching of a large text. The data structure is simply an array containing all the pointers to the text suffixes sorted in lexicographical (alphabetical) order. Each suffix is a string starting at a certain poinsition in the text and ending at the end of the text. Searching a text can be performed by binary search using the suffix array.

Let's get started with the suffix array construction. Suppose that we have the sample text ``abracadabra'' and wish to construct the suffix array for the sample text.

First, we should assign index points to the sample text. Index points specify positions where search can be performed. In our example, index points are assigned character by character. Thus, we can search the sample text with the suffix array at any positions later.

Second, we should sort the index points according to thier corresponding suffixes. The correspondance between the index points and the suffixes looks like

After sorting:

Finally, The resulting index points become the suffix array for the sample text.

Search of the sample text can be performed by binary search using the created suffix array. The following figure shows the process of searching the sample text for `ra'. Numbered arrows shows the order of processing.

References


A Brief Introduction of Deep Learning

导语 前面已经讲了一些机器学习的相关概念与理解方式,而现在只要提到机器学习,则不得不提深度学习。作为机器学习的一个重要分支,在硬件计算能力日益发达的今天,深度学习日益受到重视,变得广为人知。那么深度...
  • cherrylvlei
  • cherrylvlei
  • 2016年11月27日 20:13
  • 655

A Brief Introduction to REST

 A Brief Introduction to REST Posted by Stefan Tilkov on Dec 10, 2007 03:42 AM Communi...
  • niusi123
  • niusi123
  • 2007年12月11日 16:53
  • 650

后缀数组(SuffixArray) 学习笔记

后缀数组     前面有介绍过后缀树,后缀树对于我们针对某些字符串的处理使得如鱼得水,美中不足的是后缀树的代码实现复杂,只能让很多人望而却步。这次我们来介绍后缀树组:一个处理字符串的有力工具,也是一个...
  • dreamhougf
  • dreamhougf
  • 2015年02月11日 16:46
  • 637

[机器学习入门] 李弘毅机器学习笔记-7 (Brief Introduction of Deep Learning;深度学习简介)

[机器学习入门] 李弘毅机器学习笔记-7 (Brief Introduction of Deep Learning;深度学习简介) PDF VIDEOUps and downs of Deep...
  • soulmeetliang
  • soulmeetliang
  • 2017年06月05日 19:32
  • 1911

UBIFS设计简介 - A Brief Introduce to the Design of UBIFS

项目闲暇,想了解下UBIFS,就先从UBIFS的设计文档翻译开始吧,以后有机会有时间能分析下UBIFS源码 flash memory文件系统需要异地更新(out-of-place updates). ...
  • kickxxx
  • kickxxx
  • 2011年06月28日 19:18
  • 3763

Suffix Array 后缀数组

后缀数组 顾名思义,SuffixArray(以下有时简称SA) 和字符串的后缀有关。 后缀:字符串中某个位置一直到结尾的子串。(SA中讨论包括了原串和空串),所以共有len+1个后缀。 ...
  • xuelanghu407
  • xuelanghu407
  • 2015年08月25日 00:19
  • 1625

后缀数组suffix array

suffix array,LCP
  • u014141559
  • u014141559
  • 2014年08月12日 09:42
  • 703

suffix_array(后缀数组)

#include #include #include #include using namespace std;vector grade; vector sa; vector tempg;...
  • wdcxccsdn
  • wdcxccsdn
  • 2015年05月17日 10:48
  • 336

A Gentle Introduction to Markov Chain Monte Carlo (MCMC)

Posted by dustinstansbury Applying probabilistic models to data usually involves integrating ...
  • lcj_cjfykx
  • lcj_cjfykx
  • 2014年01月24日 00:34
  • 1491

???题目2 : Reverse Suffix Array

题目2 : Reverse Suffix Array 时间限制:1000ms 单点时限:1000ms 内存限制:256MB 描述 There is a strong data st...
  • qq_37275680
  • qq_37275680
  • 2017年09月26日 19:38
  • 138
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Brief Introduction to Suffix Array
举报原因:
原因补充:

(最多只允许输入30个字)