第四章字符串与多维数组
4.1 字符串
串的逻辑结构
串:零个或多个字符组成的有限序列。
串长度:串中所包含的字符个数。
空串:长度为0的串,记为:" "。
非空串通常记为:
S="s1s2 …… sn "
其中:S是串名,双引号是定界符,双引号引起来的部分是串值,si(1≤i≤n)是一个任意字符。
子串:串中任意个连续的字符组成的子序列。
主串:包含子串的串。
子串的位置:子串的第一个字符在主串中的序号。
S1="ab12cd"
S2="ab12"
S3="ab13"
S4="ab12φ"
S5=""
S6="φφφ"
串的数据对象约束为某个字符集。
微机上常用的字符集是标准ASCII码,由 7位二进制数表示一个字符,总共可以表示 128 个字符。
扩展ASCII码由 8位二进制数表示一个字符,总共可以表示 256 个字符,足够表示英语和一些特殊符号,但无法满足国际需要。
Unicode由 16位二进制数表示一个字符,总共可以表示 216个字符,能够表示世界上所有语言的所有字符,包括亚洲国家的表意字符。为了保持兼容性,Unicode字符集中的前256个字符与扩展ASCII码完全相同。
串的比较:通过组成串的字符之间的比较来进行的。
给定两个串:X="x1x2…xn"和Y="y1y2…ym",则:
1.当n=m且x1=y1,…,xn=ym时,称X=Y;
2.当下列条件之一成立时,称X<Y:
⑴n<m且xi=yi(1≤i≤n);
⑵存在k≤min(m,n),使得xi=yi(1≤i≤k-1)且xk<yk。
模式匹配
模式匹配:给定主串S="s1s2…sn"和模式T="t1t2…tm",在S中寻找T的过程称为模式匹配。如果匹配成功,返回T 在S中的位置;如果匹配失败,返回0。
模式匹配——BF算法
1.在串S和串T中设比较的起始下标i和j;
2.循环直到S或T的所有字符均比较完
2.1 如果S[i]=T[j],继续比较S和T的下一个字符;
2.2 否则,将i和j回溯,准备下一趟比较;
3.如果T中所有字符均比较完,则匹配成功,返回匹配的起始比较下标;否则,匹配失败,返回0;
模式匹配——KMP算法(基本思想:主串不进行回溯)
注:i可以不回溯,模式向右滑动到的新比较起点k,并且k仅与模式串T有关!
4.2 多维数组
数组的定义
数组是由一组类型相同的数据元素构成的有序集合,每个数据元素称为一个数组元素(简称为元素),每个元素受n(n≥1)个线性关系的约束,每个元素在n个线性关系中的序号i1、i2、…、in称为该元素的下标,并称该数组为n维数组。
数组的特点
元素本身可以具有某种结构,属于同一数据类型;
数组是一个具有固定格式和数量的数据集合
数组的基本操作
⑴存取:给定一组下标,读出对应的数组元素;
⑵修改:给定一组下标,存储或修改与其相对应的数组元素。
存取和修改操作本质上只对应一种操作——寻址
数组的存储结构与寻址——二维数组
常用的映射方法有两种:
按行优先:先行后列,先存储行号较小的元素,行号相同者先存储列号较小的元素。
按列优先:先列后行,先存储列号较小的元素,列号相同者先存储行号较小的元素。
4.3 矩阵的压缩存储
特殊矩阵和稀疏矩阵
特殊矩阵:矩阵中很多值相同的元素并且它们的分布有一定的规律。
稀疏矩阵:矩阵中有很多零元素。
压缩存储的基本思想是:
⑴为多个值相同的元素只分配一个存储空间;
⑵对零元素不分配存储空间
特殊矩阵的压缩存储——三角矩阵
下三角矩阵的压缩存储
存储:下三角元素
对角线上方的常数——只存一个
上三角矩阵的压缩存储
存储:上三角元素
对角线上方的常数——只存一个
特殊矩阵的压缩存储——对角矩阵
对角矩阵:所有非零元素都集中在以主对角线为中心的带状区域中,除了主对角线和它的上下方若干条对角线的元素外,所有其他元素都为零
稀疏矩阵的压缩存储
将稀疏矩阵中的每个非零元素表示为:
(行号,列号,非零元素值)——三元组
template <class DataType>
struct element
{
int row, col; //行号,列号
DataType item //非零元素值
};
稀疏矩阵的压缩存储——三元组顺序表
三元组表:将稀疏矩阵的非零元素对应的三元组所构成的集合,按行优先的顺序排列成一个线性表。
稀疏矩阵的压缩存储——十字链表
采用链接存储结构存储三元组表,每个非零元素对应的三元组存储为一个链表结点