【学习笔记----数据结构08-串】

最新推荐文章于 2022-09-16 12:31:07 发布

不一样的水果

最新推荐文章于 2022-09-16 12:31:07 发布

阅读量818

点赞数

分类专栏：结构算法

结构算法专栏收录该内容

26 篇文章 0 订阅

订阅专栏

串

定义：是由零个或多个字符组成的有限序列，又名叫字符串。

串的比较

串的比较是通过组成串的字符之间的编码来进行的，而字符的编码指的是字符在对应字符集中的序号。

ASCII编码，由7位二进制数表示一个字符，总共可以表示128个字符

扩展ASCII码,由8位二进制数表示一人字符，总共可以表示256个字符

Unicode编码由16位二进制数表示一个字符，总共就可以表示2¹⁶ 约6.5万多个字符，当然为了兼容ASCII前256个字符与ASCII码相同。

所以我们在C语言中比较两个串是否相等，必须是它们串的长度以及它们各个对应位置的字符都相等时，才算是相等。

串的抽象数据类型

串的逻辑结构和线性表很相似，不同之处在于串针对的是字符集，也就是串中的元素都是字符。

不同之处：对于串的基本操作与线性表是有很大差别的。线性表更关注的是单个元素的操作，比如查找一个元素，插入或删除一个元素，但串中的更多的是查找子串位置、得到指定位置子串、替换子串操作。

ADT 串（string）

Data

串中元素仅由一个字符组成，相邻元素具有前驱和后继关系

Operation

StrAssign(T,*chars):生成一个其值等于字符串常量chars的串T

StrCopy(T,S):串S存在，由串S复制得串T

ClearString(S):串S存在，将串清空。

StringEmpty(S):若串为空，返回true，否则返回false

StrLength(S):返回串S的元素个数，即串的长度。

StrCompare(S,T):若S>T，返回值>0，若S=T，返回0，若S<T，返回<0

Concat(T,S1,S2):由T返回由S1和S2组成的新串

SubString(Sub,S,pos,len):串S存在，1<=pos<=StrLength(S)且0<=len<=StrLength(S)-pos+1，用Sub返回串S的第pos个字符起长度为len子串

Index(S,T,pos): 串S和T存在，T是非空串。1<=pos<=StrLength(S)，若主串S存在和串T相同的子串，则返回它在主串S中第pos个字符之后第一次出现的位置，否则返回0。

Replace(S,T,V):串S、T和V存在，T是非空串。用V替换主串S中出现的所有与T相等的不重叠的子串

StrInsert(S,pos,T):串S和T存在，1<=pos<StrLength(S)+1，在串S的第pos个字符之前插入串T。

StrDelete(S,pos,len):串S存在，1<=pos<=StrLength(S)-len+1。从串S中删除第pos个字符起长度为len的子串

endADT

我们来看一个Index的实现算法。

int Inext(String S,String T,int pos)

{

int n,m,i;

String sub;

if(pos>0)

{

n=StringLength(S); //主串长度

m=StringLength(T);//子串长度

i=pos;

while(i<=n-m+1)

{

SubString(sub,S,i,m);

if(StrCompare(sub,T)!=0)

++i;

else

return i;

}

串的存储结构

串的顺序存储结构

串的顺序存储结构是用一组地址连续的存储单元来存储串中的字符序列的。按照预定义的大小，为每个定义的串变量分配一个固定长度的存储区。一般是用定长数组来定义。既然是定长数组，就存在一个预定义的最大串长度，一般可以将实际中长度值保存在数组的0下标位置。但也有些编辑语言不想这么干，觉得存个数字占个空间麻烦。它规定在串值后面加一个不计入串长度的结束标记字符。比如“\0”。这个时候你想知道长度就需要遍历计算一下。其实还是占用一个空间。

其实顺序存储方式其实是有问题的，因为字符串的操作，比如两串的连接Concat、新串的插入StrInsert，以及字符串的替换Replace，都有可能使得串序列的长度超过数组的长度MaxSize。

于是对于串的顺序存储，有一些变化，串值的存储空间可在程序执行过程中动态分配而得。比如在计算机中存在一个自由存储区，叫做“堆”。这个堆可以由C语言的动态分配函数malloc()和free()来管理。

串的链式存储结构

对于串的链式存储结构，与线性表是相似的，但由于串结构的特殊性，结构中的每个元素数据是一个字符，如果也简单的应用链表存储串值，一个结点对应一个字符，就会存在很大的空间浪费。因此一个结点可以存放多个字符，最后一个结点若是未被占满时，可以用#或其他非串值字符补全。当然一个结点存多少个字符才合适变得很重要，这会直接影响着串处理的效率，需要根据实际情况做出选择。但串的链式存储结构除了在连接串与串操作时有一定方便之外，总的来说不如顺序存储灵活。性能也不如顺序存储结构好。