4.1 串的概念及存储结构
字符串是n个字符的有限序列(n >= 0)
notes:1.空串和空白串不同,例如" " 和 ""分别表示长度为1的空白串和长度为0的空串;
2.通常将子串在主串中首次出现时,子串首字符对应主串中的序号,定义为子串在主串中的位置;
3.空串是任意串的子串,任意串是其自身的子串;
//字符串初始化
char name[10];
name = "Qingdao"; × 数组名是地址常量
//常见字符串函数
1.单个字符串输入函数gets(str)
char name[10];
gets(name);
2.字符串输出函数puts(str)
char name[10];
gets(name);
puts(name);
3.字符串求长度strlen(str)
(字符串长度不包括'\0'和分界符)
int m = strlen("University");
printf("%d\n", m);//输出10
4.字符串连接函数strcat(str1, str2)
str1 = "Qingdao \0";//连接前
str2 = "University\0";//连接前
str1 = "QingdaoUniversity\0";//连接后
str2 = "University\0";//不变
5.字符串比较函数strcmp(str1,str2)
//从两个字符串第一个字符开始,逐个字符进行比较,全部字符相等则函数返回0,否则在不相等字符处停止比较,函数返回其差值
//比较基于ASCII码
str1 = "University" i的代码值105
str2 = "Universal" a的代码值97,差8
4.2串的表示和实现
1.定长顺序存储表示
#define MAXSTRLEN 256 //顺序串的预设长度
typedef struct { //顺序串的定义
char SString[MAXSTRLEN];//存储字符数组
int length; //串中实际字符个数
}SqString;
2.堆分配存储表示
#define MAXSTRLEN 256
typedef struct {
char *ch; //串的存储数组
int maxSize; //串数组的最大长度
int length; //串的当前长度
};
//1.初始化空串算法
void iniString(Hstring &S)
{
//初始化:创建字符串S的存储空间并置空串
//分配字符数组空间
S.ch = (char *)malloc(MAXSTRLEN*sizeof(char));
if (S.ch == NULL) exit(1); //判断分配成功与否
S.ch[0] = '\0'; //置空串
S.maxSize = MAXSTRLEN; //置串的最大字符数
S.length = 0; //实际字符数置0
}
//2.提取子串算法
//可以全部提取 && 只能从pos取到串尾
HString subString(HString &s, int pos, int len)
{
//在串s中连续取从pos开始的len个字符串,构成子串返回
//若提取失败则函数返回NULL
HString tmp;
//创建子串空间
tmp.ch = (char *)malloc(MAXSTRLEN*sizeof(char));
tmp.maxSize = MAXSTRLEN;
//参数不合理,返回空串
if (pos < 0 || len < 0 || pos + len - 1 >= s.maxSize)
{
tmp.length = 0;
tmp.ch[0] = '\0';
}
else
{//若提取个数超出串尾,修改个数
if (pos + len - 1 >= s.length)
len = s.length - pos;
for (int i = 0, j = pos; i < len; i++, j++)
tmp.ch[i] = s.ch[j];//复制子串的字符
tmp.length = len;
tmp.ch[len] = '\0';
}
return tmp;//返回复制的子串
}
//3.串的连接算法
void concat(HeapString &s, HeapString &t)
{
//函数将串t复制到串s之后,通过串s返回结果,串t不变
if (s.length + t.length <= s.maxSize)
{
//原空间可容纳连接后的串
for (int i = 0; i < t.n; i++)
s.ch[s.length + i] = t.ch[i];//串t复制到串s后
s.length = s.length + t.length;
s.ch[s.length] = '\0';
}
else {//原空间容不下连接后的串
char *tmp = s.ch;
s.maxSize = s.length + t.length;
//按新的大小分配存储空间
s.ch = (char*)malloc((s.maxSize + 1) * sizeof(char));
strcpy(s.ch, tmp);//复制原串s数组
strcat(s.ch, t.ch);//连接串t数组
s.length = s.length + t.length;
free(tmp);
}
}
3.块链存储表示
//使用单链表作为字符串的存储表示,此即字符串的链接存储表示
//链表的每个结点可以存储1个字符,称其"块的大小"为1,也可以存储n个字符,称其“块的大小”为n
//定义存储密度为:
存储密度 = 串值所占的存储位/实际分配的存储位
存储密度越高,存储利用率越高
#define blockSize 4//由使用者定义的结点大小
typedef struct block {//链表结点的结构定义
char ch[blockSize];
struct block *next;
}Chunk;
typedef struct{//链表的结构定义
Chunk *first, *last;//链表的头指针和尾指针
int length;//串的当前长度
}LString;