25计算机考研,数据结构知识点整理(内容借鉴了王道408+数据结构教材),还会不断完善所整理的内容,后续的内容也会不断更新(可以关注),若有错误和不足欢迎各位朋友指出!
一.串的基本概念
字符串(string)是由零个或多个字符组成的有限序列。记为 S= ',... ,,,...,'(n>0)
其中:
串名:S,串的名字
串值:用单引号括起来的字符序列就是串的值,每个(1≤i≤n)可以是字母数字或其他字符。
串长:n是串中字符的个数,即串的长度,n=0时的串称为空串(null string),用∅表示
需要特别指出的是,串值必须用一对单引号括起来(C语言中是双引号),但引号是定界符它不属于串,其作用是避免串值与变量名或常混淆
子串:串中任意连续的字符组成的子序列(含空串)称为该串的子串。
真子串:指不包含自身的所有子串
主串:包含子串的串称为主串,子串为主串的一部分
子串在主串中的位置:通常将字符在串中的序号称为该字符在串中的位置(字符位置)。子串在主串中的位置则以子串的第一个字符在主串中的位置来表示(子串位置)。
假设有串 A='China Beijing',B='Beijing',C='China',则它们的长度分别为13、7和5。B和
C是A的子串,B在A中的位置是7(有空格),C在A中的位置是1。
串相等:当且仅当两个串的值相等时,称这两个串是相等的(所有空串是相等的),即只有当两个串的长度相等,并且每个对应位置的字符都相等时才为串相等。
空格串≠空串:注意,空串和空格串(blank string)的区别:由一个或多个作为特殊字符的空格组成的串,称为空格串,其长度为串中空格字符的个数;而空串是无任何字符组成的串,其串长度为零。因此,串也是一种特定的线性表,串的逻辑结构和线性表极为相似,其特定性仅在于串的数据对象限定为字符集。
串的抽象数据类型定义:
ADT String{
数据对象:D=|ai,ai,CharacterSet,i=1,2,…,n,n≥0}
结构关系:R=|<ai,ai+1>|ai,ai+1,a∈D,i=1,…,n-l,n≥1}
基本操作:
①StrAssign(S,chars)
操作前提:chars是字符串常量。
操作结果:生成一个值等于chars的串S.
② Strlnsert(S,pos,T)
操作前提:串S存在,1≤pos≤StrLength(S)+1。
操作结果:在串S的第pos个字符之前插入串T。
③ StrDelete(S,pos,len)
操作前提:串S存在,1<pos≤StrLength(S)+1。
操作结果:从串S中删除第pos个字符起长度为len的子串。
④ StrCopy(S,T)
操作前提:串S存在。
操作结果:由串T复制得串S。
⑤ StEmpty(S)
操作前提:串S存在。
操作结果:若串S为空串,则返回TRUE,否则返回FALSE。
⑥ StrCompare(S,T)
操作前提:串S和T存在。
操作结果:若S>T,则返回值大于0;如S=T,则返回值0;若S<T,则返回值小于0
⑦ StLength(S)
操作前提:串S存在。
操作结果:返回串S的长度,即串S中的字符个数。
⑧ SuClear(S)
操作前提:串S存在。
操作结果:将S清为空串。
⑨ StrCat(S,T)
操作前提:串S和T存在。
操作结果:将串T的值连接在串S的后面。
⑩ SubString(Sub,S,pos,len)
操作前提:串S存在,1≤pos≤StrLength(S)且l≤len≤StrLengh(S)-pos+1。
操作结果:用Sub返回串S的第pos个字符起长度为len的子串。
Strlndex(S,pos,T)
操作前提:串S和T存在,T是非空串,1<pos<StrLength(S)。
操作结果:若串S中存在和串T相同的子串,则返回它在串S中第pos个字符之
后第一次出现的位置;否则返回0。
StrReplace(S,T,V)
操作前提:串S、T和V存在,且T是非空串。
操作结果:用V替换串S中出现的所有与相等的不重叠的子串。
StrDestroy(S)
操作前提:串S存在。
操作结果:销毁串S。
}ADT String;
二.串的存储结构
常用的实现的存储结构有:定长顺序串、堆串(堆分配)、串块链(块链)
1.定长顺序存储表示
类似于线性表的顺序存储结构,用一组地址连续的存储单元来存储串值的字符序列。在串的定长顺序存储结构中,为每个串变量分配一个固定长度的存储区,即定长数组。
#define MAXLEN 255 //预定义最大串长为 255
typedef struct{
char ch[MAXLEN]; //每个分量存储一个字符
int length; //串的实际长度
}SString;
串的实际长度只能小于或等于MAXLEN,超过预定义长度的串值会被舍去,称为截断。串长有两种表示方法:一是如上述定义描述的那样,用一个额外的变量len来存放串的长度:二是在串值后面加一个不计入串长的结束标记字符“\0”,此时的串长为隐含值。
在一些串的操作(如插入、联接等)中,若串值序列的长度超过上界MAXLEN,约定用“截断”法处理,要克服这种弊端,只能不限定串长的最大长度,即采用动态分配的方式。
2.堆分配存储表示
字符串包括串名与串值两部分,串名用符号表存储,而串值采用堆串存储。
符号表:所有串名的存储映像构成一个符号表。借助此结构可以在串名和串值之间建立一个对应关系,称为串名的存储映像。
堆串:以一组地址连续的存储单元顺序存放串中的字符,但它们的存储空间是在程序执行过程中动态分配的。系统将一个地址连续、容量很大的存储空间作为字符串的可用空间每当建立一个新申时,系统就从该空间中分配一个大小和字符串长度相同的空间用于存储新串的串值。