- 算法1:
串采用定长顺序存储结构(由c4-1.h定义)的基本操作(12个)
#define DestroyString ClearString // DestroyString()与ClearString()作用相同
#define InitString ClearString // InitString()与ClearString()作用相同
Status StrAssign(SString T,char* chars)
{ // 生成一个其值等于chars的串T
int i;
if(strlen(chars)>MAX_STR_LEN) // chars的长度大于最大串长
return ERROR;
else
{ T[0]=strlen(chars); // 0号单元存放串的长度
for(i=1;i<=T[0];i++) // 从1号单元起复制串的内容
T[i]=*(chars+i-1);
return OK;
}
}
void StrCopy(SString T,SString S)
{ // 由串S复制得串T
int i;
for(i=0;i<=S[0];i++)
T[i]=S[i];
}
Status StrEmpty(SString S)
{ // 若S为空串,则返回TRUE;否则返回FALSE
if(S[0]==0)
return TRUE;
else
return FALSE;
}
int StrCompare(SString S,SString T)
{ // 初始条件:串S和串T存在
// 操作结果:若S>T,则返回值>0;若S=T,则返回值=0;若S<T,则返回值<0
int i;
for(i=1;i<=S[0]&&i<=T[0];++i)
if(S[i]!=T[i])
return S[i]-T[i];
return S[0]-T[0];
}
int StrLength(SString S)
{ // 返回串S的元素个数
return S[0];
}
void ClearString(SString S)
{ // 初始条件:串S存在。操作结果:将S清为空串
S[0]=0; // 令串长为零
}
Status Concat(SString T,SString S1,SString S2) // 算法4.2修改
{ // 用T返回S1和S2连接而成的新串。若未截断,则返回TRUE;否则返回FALSE
int i;
if(S1[0]+S2[0]<=MAX_STR_LEN) // 未截断
{ for(i=1;i<=S1[0];i++)
T[i]=S1[i];
for(i=1;i<=S2[0];i++)
T[S1[0]+i]=S2[i];
T[0]=S1[0]+S2[0];
return TRUE;
}
else // 截断S2
{ for(i=1;i<=S1[0];i++)
T[i]=S1[i];
for(i=1;i<=MAX_STR_LEN-S1[0];i++) // 到串长为止
T[S1[0]+i]=S2[i];
T[0]=MAX_STR_LEN;
return FALSE;
}
}
Status SubString(SString Sub,SString S,int pos,int len)
{ // 用Sub返回串S的自第pos个字符起长度为len的子串。算法4.3
int i;
if(pos<1||pos>S[0]||len<0||len>S[0]-pos+1) // pos和len的值超出范围
return ERROR;
for(i=1;i<=len;i++)
Sub[i]=S[pos+i-1];
Sub[0]=len;
return OK;
}
int Index1(SString S,SString T,int pos)
{ // 返回子串T在主串S中第pos个字符之后的位置。若不存在,则函数值为0。
// 其中,T非空,1≤pos≤StrLength(S)。算法4.5
int i,j; // 指示主串S和子串T的当前比较字符
if(1<=pos&&pos<=S[0]) // pos的范围合适
{ i=pos; // 从主串S的第pos个字符开始和子串T的第1个字符比较
j=1;
while(i<=S[0]&&j<=T[0])
if(S[i]==T[j]) // 当前两字符相等
{ ++i; // 继续比较后继字符
++j;
}
else // 当前两字符不相等
{ i=i-j+2; // 两指针后退重新开始匹配
j=1;
}
if(j>T[0]) // 主串S中存在子串T
return i-T[0];
else // 主串S中不存在子串T
return 0;
}
else // pos的范围不合适
return 0;
}
Status StrInsert(SString S,int pos,SString T)
{ // 初始条件:串S和T存在,1≤pos≤StrLength(S)+1
// 操作结果:在串S的第pos个字符之前插入串T。完全插入返回TRUE,部分插入返回FALSE
int i;
if(pos<1||pos>S[0]+1) // pos超出范围
return ERROR;
if(S[0]+T[0]<=MAX_STR_LEN) // 完全插入
{ for(i=S[0];i>=pos;i--) // 移动串S中位于pos之后的字符
S[i+T[0]]=S[i]; // 串S向后移串T的长度,为插入串T准备空间
for(i=pos;i<pos+T[0];i++) // 在串S中插入串T
S[i]=T[i-pos+1];
S[0]+=T[0]; // 更新串S的长度
return TRUE; // 完全插入的标记
}
else // 部分插入
{ for(i=MAX_STR_LEN;i>=pos+T[0];i--) // 移动串S中位于pos之后且移后仍在串内的字符
S[i]=S[i-T[0]];
for(i=pos;i<pos+T[0]&&i<=MAX_STR_LEN;i++) // 在串S中插入串T(也可能是部分插入)
S[i]=T[i-pos+1];
S[0]=MAX_STR_LEN; // 串S的长度为串的最大长度
return FALSE; // 部分插入的标记
}
}
Status StrDelete(SString S,int pos,int len)
{ // 初始条件:串S存在,1≤pos≤StrLength(S)-len+1
// 操作结果:从串S中删除自第pos个字符起长度为len的子串
int i;
if(pos<1||pos>S[0]-len+1||len<0) // pos和len的值超出范围
return ERROR; // 删除不成功的标记
for(i=pos+len;i<=S[0];i++) // 对于删除的子串之后的所有字符
S[i-len]=S[i]; // 向前移动删除子串的长度
S[0]-=len; // 更新串S的长度
return OK; // 删除成功的标记
}
void StrPrint(SString S)
{ // 输出字符串S。新增
int i;
for(i=1;i<=S[0];i++)
printf("%c",S[i]);
printf("\n");
}
- 算法2:
串采用堆分配存储结构(由c4-2.h定义)的基本操作(12个)
#define DestroyString ClearString // DestroyString()与ClearString()作用相同
void InitString(HString &S)
{ // 初始化(产生空串)字符串S。新增
S.length=0;
S.ch=NULL;
}
void ClearString(HString &S)
{ // 将S清为空串。在教科书第77页
free(S.ch); // 释放S.ch所指空间
InitString(S); // 初始化串S
}
void StrAssign(HString &T,char* chars)
{ // 生成一个其值等于串常量chars的串T。在教科书第76页
int i,j;
if(T.ch) // T指向某存储单元
free(T.ch); // 释放T原有存储空间
i=strlen(chars); // 求chars的长度i
if(!i) // chars的长度为0
InitString(T); // 生成空串
else // chars的长度不为0
{ T.ch=(char*)malloc(i*sizeof(char)); // 分配串存储空间
if(!T.ch) // 分配串存储空间失败
exit(OVERFLOW);
for(j=0;j<i;j++) // 分配串存储空间成功后,复制串chars[]到串T
T.ch[j]=chars[j];
T.length=i; // 更新串T的长度
}
}
void StrCopy(HString &T,HString S)
{ // 初始条件:串S存在。操作结果:由串S复制得串T
int i;
if(T.ch) // 串T不空
free(T.ch); // 释放串T原有存储空间
T.ch=(char*)malloc(S.length*sizeof(char)); // 分配串存储空间
if(!T.ch) // 分配串存储空间失败
exit(OVERFLOW);
for(i=0;i<S.length;i++) // 从第1个字符到最后一个字符
T.ch[i]=S.ch[i]; // 逐一复制字符
T.length=S.length; // 复制串长
}
Status StrEmpty(HString S)
{ // 初始条件:串S存在。操作结果:若串S为空,则返回TRUE;否则返回FALSE
if(S.length==0&&S.ch==NULL) // 空串标志
return TRUE;
else
return FALSE;
}
int StrCompare(HString S,HString T)
{ // 若串S>串T,则返回值>0;若S=T,则返回值=0;若S<T,则返回值<0。在教科书第77页
int i;
for(i=0;i<S.length&&i<T.length;++i) // 在有效范围内
if(S.ch[i]!=T.ch[i]) // 逐一比较字符
return S.ch[i]-T.ch[i]; // 不相等,则返回2字符ASCII码之差
return S.length-T.length; // 在有效范围内,字符相等,但长度不等,返回长度之差
}
int StrLength(HString S)
{ // 返回串S的元素个数,称为串的长度。在教科书第77页
return S.length;
}
void Concat(HString &T,HString S1,HString S2)
{ // 用串T返回由串S1和串S2连接而成的新串。在教科书第77页
int i;
if(T.ch) // 串T不空
free(T.ch); // 释放串T原有存储空间
T.length=S1.length+S2.length; // 串T的长度=串S1的长度+串S2的长度
T.ch=(char*)malloc(T.length*sizeof(char)); // 分配串T的存储空间
if(!T.ch) // 分配串存储空间失败
exit(OVERFLOW);
for(i=0;i<S1.length;i++) // 将串S1的字符逐一复制给串T
T.ch[i]=S1.ch[i];
for(i=0;i<S2.length;i++) // 将串S2的字符逐一复制给串T(接在串S1的字符之后)
T.ch[S1.length+i]=S2.ch[i];
}
Status SubString(HString &Sub,HString S,int pos,int len)
{ // 用Sub返回串S的第pos个字符起长度为len的子串。
// 其中,1≤pos≤StrLength(S)且0≤len≤StrLength(S)-pos+1。在教科书第77页
int i;
if(pos<1||pos>S.length||len<0||len>S.length-pos+1) // pos和len的值超出范围
return ERROR; // 无法用Sub返回子串
if(Sub.ch) // 串Sub不空
free(Sub.ch); // 释放串Sub原有存储空间
if(!len) // 空子串
InitString(Sub); // 初始化串Sub
else // 完整子串
{ Sub.ch=(char*)malloc(len*sizeof(char)); // 分配串Sub的存储空间
if(!Sub.ch) // 分配串存储空间失败
exit(OVERFLOW);
for(i=0;i<=len-1;i++) // 将串S第pos个字符起长度为len的子串的字符逐一复制给串Sub
Sub.ch[i]=S.ch[pos-1+i];
Sub.length=len; // 串Sub的长度
}
return OK;
}
Status StrInsert(HString &S,int pos,HString T) // 算法4.4
{ // 1≤pos≤StrLength(S)+1。在串S的第pos个字符之前插入串T
int i;
if(pos<1||pos>S.length+1) // pos不合法
return ERROR;
if(T.length) // T非空
{ S.ch=(char*)realloc(S.ch,(S.length+T.length)*sizeof(char)); // 重分S存储空间
if(!S.ch) // 重新分配串S的存储空间失败
exit(OVERFLOW);
for(i=S.length-1;i>=pos-1;--i) // 为插入T而腾出位置
S.ch[i+T.length]=S.ch[i];
for(i=0;i<T.length;i++) // 插入T
S.ch[pos-1+i]=T.ch[i];
S.length+=T.length; // 更新串S的长度
}
return OK;
}
Status StrDelete(HString &S,int pos,int len)
{ // 从串S中删除第pos个字符起长度为len的子串
int i;
if(S.length<pos+len-1) // pos和len的值超出范围
return ERROR;
for(i=pos-1;i<=S.length-len;i++) // 将待删除子串之后的字符逐一前移
S.ch[i]=S.ch[i+len];
S.length-=len; // 更新串S的长度
S.ch=(char*)realloc(S.ch,S.length*sizeof(char)); // 重新分配串S的存储空间(减少)
return OK;
}
void StrPrint(HString S)
{ // 输出字符串S。新增
int i;
for(i=0;i<S.length;i++)
printf("%c",S.ch[i]);
printf("\n");
}
- 算法3:
串的模式匹配算法——KMP算法。
#include"c1.h"
#include"c4-1.h" // 串的定长顺序存储结构
#include"bo4-1.cpp" // 定长顺序存储结构的基本操作(12个)
void get_next(SString T,int next[])
{ // 求模式串T的next函数值并存入数组next。算法4.7
int i=1,j=0;
next[1]=0; // T的第1个字符与主串“失配”时,主串的下一字符与T的第1个字符比较
while(i<T[0]) // 当T[0]>1时,next[2]=1
if(j==0||T[i]==T[j]) // 初态或两字符相等
{ ++i; // 各+1继续向后比较
++j;
next[i]=j; // 主串和T在第i个字符不匹配时,前j-1个字符是匹配的,只须与第j个字符比较
}
else // 两字符不等
j=next[j]; // j减小到前面字符相等之处
}
void get_nextval(SString T,int nextval[])
{ // 求模式串T的next函数修正值并存入数组nextval。算法4.8
int i=1,j=0;
nextval[1]=0; // T的第1个字符与主串“失配”,主串的下一字符与T的第1个字符比较
while(i<T[0])
if(j==0||T[i]==T[j])
{ ++i;
++j;
if(T[i]!=T[j]) // 此处与算法4.7不同
nextval[i]=j;
else
nextval[i]=nextval[j];
}
else
j=nextval[j]; // j减小到前面字符相等之处
}
int Index_KMP(SString S,SString T,int pos,int next[])
{ // 利用模式串T的next数组求T在主串S中第pos个字符之后的位置的KMP算法。
// 其中,T非空,1≤pos≤StrLength(S)。算法4.6
int i=pos,j=1; // 初始位置
while(i<=S[0]&&j<=T[0]) // i和j分别都未超出主串S和模式串T的范围
if(j==0||S[i]==T[j]) // 继续比较后继字符
{ ++i;
++j;
}
else // 模式串向右移动
j=next[j];
if(j>T[0]) // 匹配成功
return i-T[0];
else
return 0;
}
void main()
{
int i,*p;
SString s1,s2; // 以教科书算法4.8之上的数据为例
StrAssign(s1,"aaabaaaab"); // 由"aaabaaaab"生成主串s1
printf("主串为");
StrPrint(s1); // 输出串s1
StrAssign(s2,"aaaab"); // 由"aaaab"生成子串s2
printf("子串为");
StrPrint(s2); // 输出串s2
p=(int*)malloc((StrLength(s2)+1)*sizeof(int)); // 生成s2的next数组,[0]不用
get_next(s2,p); // 利用算法4.7,求得next数组,存于p中
printf("子串的next数组为");
for(i=1;i<=StrLength(s2);i++)
printf("%d ",*(p+i));
printf("\n");
i=Index_KMP(s1,s2,1,p); // 利用算法4.6求得串s2在s1中首次匹配的位置i
if(i)
printf("主串和子串在第%d个字符处首次匹配\n",i);
else
printf("主串和子串匹配不成功\n");
get_nextval(s2,p); // 利用算法4.8,求得nextval数组,存于p中
printf("子串的nextval数组为");
for(i=1;i<=StrLength(s2);i++)
printf("%d ",*(p+i));
printf("\n");
printf("主串和子串在第%d个字符处首次匹配\n",Index_KMP(s1,s2,1,p));
}
算法4:
与存储结构无关的两个基本操作。
int Index(String S,String T,int pos) // 算法4.1
{ // T为非空串。若主串S中第pos个字符之后存在与T相等的子串,
// 则返回第一个这样的子串在S中的位置;否则返回0
int n,m,i;
String sub;
InitString(sub); // 新增
if(pos>0)
{ n=StrLength(S); // 主串S的长度
m=StrLength(T); // 模式串T的长度
i=pos;
while(i<=n-m+1) // i从串S的pos到倒数第m个
{ SubString(sub,S,i,m); // 子串sub是从主串S的第i个字符起,长度为m的子串
if(StrCompare(sub,T)!=0) // 子串sub不等于模式串T
++i; // 继续向后比较
else // 子串sub等于模式串T
return i; // 返回模式串T的第1个字符在主串S中的位置
}
}
return 0; // 主串S中不存在与模式T相等的子串
}
Status Replace(String &S,String T,String V)
{ // 初始条件:串S、T和V存在,串T是非空串
// 操作结果:用串V替换主串S中出现的所有与串T相等的不重叠的子串
int i=1; // 从串S的第一个字符起查找串T
Status k;
if(StrEmpty(T)) // T是空串
return ERROR;
while(i)
{ i=Index(S,T,i); // 结果i为从上一个i之后找到的子串T的位置
if(i) // 串S中存在串T
{ StrDelete(S,i,StrLength(T)); // 删除串T
k=StrInsert(S,i,V); // 在原串T的位置插入串V
if(!k) // 不能完全插入(定长顺序存储结构有可能发生这种情况)
return ERROR;
i+=StrLength(V); // 在插入的串V后面继续查找串T
}
};
return OK;
}