目录
前言
字符串简称为串,串是由字符元素构成的,其中元素的逻辑关系也是一种线性关系。串的处理在计算机非数值处理中占有重要的地位,如信息检索、文字编辑等都是以串数据作为处理对象。
本文介绍串的基本概念、串的存储结构、串的基本运算和模式匹配算法设计。
一、串的基本概念
1.相关概念
串是由零个或多个字符组成的有限序列。有零个字符的串称为空串,用表示。串中所含字符的个数称为该串的长度(或串长)。
两个串相等当且仅当两个串的长度相等并且各对应位置上的字符都相同。一个串中任意个连续字符组成的序列称为该串的子串。空串是任何串的子串。
2.串的抽象数据类型
ADT string
{
数据对象:
D={ 为char类型}
数据关系:
基本运算:
StrAssign(&s,cstr)
DestroyStr(&s)
StrCopy(&s,t)
StrEqual(s,t)
StrLength(s)
Concat(s,t)
SubStr(s,i,j)
InsStr(s1,i,s2)
DelStr(s,i,j)
RepStr(s,i,j,t)
DispStr(s)
}
二、串的顺序存储结构——顺序串
1.顺序串的存储方式
顺序串的存储方式有两种:一种是每个字只存一个字符,称为非紧缩格式(存储密度小);另一种是每个字存放多个字符,称为紧缩格式。(阴影的字节为空闲部分)
串的紧缩格式节省存储空间,单处理单个字符不太方便,运算效率低,因为需要花费时间从同一个字中分离字符;非紧缩格式浪费存储空间,但处理单个字符或者一组连续字符方便。后面主要讨论非紧缩字符。
对于非紧缩格式的顺序串,其类型声明如下:
typedef struct
{
char data[MaxSize]; //存放串字符
int length; //存放串长
}SqString; //顺序表类型
2.顺序串串基本运算的实现
下面讨论在顺序串上实现串基本运算的算法,其中顺序串参数采用直接传递顺序串的方法,这与顺序表算法采用的顺序表指针不同。
(1)生成串StrAssign(&s,cstr)
将一个C/C++字符串常量cstr(以'\0'字符标识结尾)赋给顺序串s,即生成一个其值等于cstr的串s。
void StrAssign(SqString &s,char cstr[]) //s为引用型参数
{
int i;
for(i=0;cstr[i]!='\0';i++)
s.data[i]=cstr[i];
s.length=i; //设置串s的长度
}
(2)销毁串DestroyStr(&s)
本文的顺序串是直接采用顺序串本身来表示的,而不是顺序串指针,它的存储空间由操作系统管理,即由操作系统分配其存储空间,并在超出作用域时释放其存储空间,所以这里的销毁顺序串运算不包含任何操作。
void DestroyStr(SqString &s)
{ }
(3)串的复制StrCopy(&s,t)
将顺序串t复制给顺序串s。
void StrCopy(SqString &s,SqString t) //s为引用型参数
{
int i;
for(i=0;i<t.length;i++) //复制t的所有字符
s.data[i]=t.data[i];
s.length=t.length; //设置串s的长度
}
(4)判断串相等StrEqual(s,t)
若两个顺序串s与t相等返回真;否则返回假。
bool StrEqual(SqString s,SqString t)
{
bool same=true;int i;
if(s.length!=t.length) //长度不相等时返回0
same=false;
else
for(i=0;i<s.length;i++)
if(s.data[i]!=t.data[i]) //有一个对应字符不想同时返回假
{
same=false;
break;
}
return same;
}
(5)求串长StrLength(s)
int StrLength(SqString s)
{
return s.length;
}
(6)串的连接Concat(s,t)
返回由两个顺序串s和t连接在一起形成的结果串。
SqString Concat(SqString s,SqString t)
{
SqString str; //定义结果串
int i;
str.length=s.length+t.length;
for(i=0;i<s.length;i++) //将s.data[0..s.length-1]复制到str
str.data[i]=s.data[i];
for(i=0;i<t.length;i++) //将t.data[0..t.length-1]复制到str
str.data[i+s.length]=t.data[i];
return str;
}
(7)求子串SubStr(s,i,j)
返回顺序串s中从第个字符开始的由连续个字符组成的子串。当参数不正确时返回一个空串。
SqString SubStr(SqString s,int i,int j)
{
int k;
SqString str; //定义结果串
str.length=0; //设置str为空串
if(i<=0||i>s.length||j<0||i+j-1>s.length)
return str; //参数不正确时返回空串
for(k=i-1;k<i+j-1;k++)
str.data[k-i+1]=s.data[k]; //将s.data[i..i+j-1]复制到str
str.length=j;
return str;
}