串类型的定义
计算机非数值处理的对象基本都是字符串数据。
串
由零个或多个字符组成的有限序列
s = ‘a1a2……an’
其中,s表示串名,a1a2……an代表串值,ai可以是字母、数字或其他字符。|s|表示串长,即串中字符的数目。ai在序列中的序号(串中字符的序号从0开始)称为该字符在串中的位置。单引号本身不属于串,只起界定作用。
零个字符的串成为空串。
由一个或多个空格组成的串成为空格串。
子串
串中任意个连续字符组成的子序列
包含字串的串相应的成为主串
特别的,空串是任意串的字串,任意串是其自身的字串。
计算字串时,一定要注意是否包括空串和自身。
**字串在主串中的位置:**字串在主串中首次出现时的该字串的首字符对应的字串中的序号,也称字串在主串中的序号。(习惯序号从0开始)
基本操作
StrAssign(&T,chars);//常量赋值
StrCopy(&T,S);//拷贝赋值
StrDestroy(&S);//串的销毁
StrEmpty(S);//串是否为空
StrCompare(S,T);//串的比较
StrLength(S);//串的长度
StrCat(&T,S1,S2);//串的拼接
StrSub(&Sub,S,pos,len);//串的字串
Index(S,T,pos);//从S的pos位置查找T第一次出现位置,没有则返回-1
Replace(&S,T,V);//字串的替换
StrInsert(&S,pos,T);//串的插入
StrDelete(&S,pos,len);//子串的删除
StrClear(&S);//串的清空
上述定义的13中操作中,StrAssign(串赋值)、StrCopy(串复制)、StrCompare(串比较)、StrLength(求串长)、StrCat(串拼接)、StrSub(求子串)这六种操作构成串类型的最小操作子集。
串的表示和实现
串实际上是特殊的线性表,故其存储结构与线性表的存储结构类似,只不过串的结点是单个字符。
定长顺序存储表示
用一组地址连续的存储单元存储串值的字符序列。
按照预定义的大小,为每个定义的串变量分配一个固定长度的存储区。串的实际长度可以在此预定义长度内随意,但超过预定义长度的串值会被舍弃,称为截断。
两种顺序存储表示:
- 下标0的分量存放串的长度,其他存放字符
- 串值末尾增加一个不计入串长的结束标记字符,例如C和C++C采用‘\n’结尾
//一些操作比较简单,这里只是实现部分操作,采用的以'\n'结尾
//串拼接
Status StrCat(&T,S1,S2)
{
int len1 = StrLength(S1),len2 = StrLength(S2);
for(int i = 0;i<len1&&i<MAXSIZE;++i)
T[i] = S1[i];
for(int i = 0; i < len2 && len1 + i < MAXSIZE; ++i)
T[i+len1] = s2[i];
if(len1 + len2 > MAXSIZE)
T[MAXSIZE-1] = '\n';
else
T[len1+len2-1] = '\n';
return OK;
}
//求子串
Status StrSub(&Sub,S,pos,len)
{
int len = StrLength(S);
if(pos + len > n)
return ERROR;
for(int i = 0; i < len; ++i)
Sub[i] = S[pos+i];
Sub[len] = '\n';
return OK;
}
堆分配存储表示
在定长顺序存储中,虽然实现简单,但是由于空间一定,很容易产生截断现象,所以我们自然而然想到动态分配空间。
堆分配存储仍然采用一组地址连续的存储单元存放串值字符序列,但是存储空间是在程序执行过程中动态分配而得,所以也称为动态存储分配的顺序表。
通常,C语言中提供的串类型就是以这种存储方式实现的。系统利用函数malloc和freee进行串值空间的动态管理,为每一个新产生的串分配一个存储区,称为串值共享的存储空间为堆,仍是顺序存储。
同定长顺序存储实现,我们仍然采用C语言形式描述堆分配存储表示。我们没有显式的T[0]去描述串长,串长是一个隐含值(串以特定字符结尾)。所以,约定串长也作为存储结构的一部分。
//以下的实现中,如果不对HString进行StrAssign会导致ch指针没有分配空间。除了使用St