第四章字符串和多维数组

最新推荐文章于 2021-11-03 16:56:33 发布

BianchiHB

最新推荐文章于 2021-11-03 16:56:33 发布

阅读量136

点赞数

本文链接：https://blog.csdn.net/weixin_45655385/article/details/102878029

版权

4.2字符串

串：零个或多个字符组成的有限序列。
串长度：串中所包含的字符个数。
空串：长度为0的串，记为：" “。
非空串通常记为：
S=” s1 s2 …… sn "
其中：S是串名，双引号是定界符，双引号引起来的部分是串值，si（1≤i≤n）是一个任意字符。
子串：串中任意个连续的字符组成的子序列。
主串：包含子串的串。
子串的位置：子串的第一个字符在主串中的序号。
顺序串：用数组来存储串中的字符序列。
链接串：用链接存储结构来存储串。

模式匹配：

BF算法

给定主串S="s1s2…sn"和模式T=“t1t2…tm”，
在S中寻找T 的过程称为模式匹配。
BF（Brute-Force）算法：
基本思想：
从主串S的第0个字符开始和模式T 的第0个字符进行比较，
若相等，则继续比较两者的后续字符；
否则，从主串S的第1个字符开始和模式T 的第0个字符进行比较，
重复上述过程，直到T 中的字符全部比较完毕，则说明本趟匹配成功；或S中字符全部比较完，则说明匹配失败。
说明：模式匹配过程要进行多趟的匹配，每趟匹配要进行若干次的比较
算法：

在串S和串T中设比较的起始下标i和j；
循环直到S或T的所有字符均比较完；
2.1 如果S[i]==T[j]，继续比较S和T的下一个字符；
2.2 否则，将i和j回溯(i=i-j+1,j=0)，准备下一趟比较；
如果T中所有字符均比较完，则匹配成功，返回匹配的起始比较下标(i-j)；否则，匹配失败，返回-1；

int BF(char S[ ], char T[ ])
{
     i=0; j=0;   
    while (i<S.Length（）&&j<T.length())
    {
         if (S[i]==T[j]) {
             i++;   j++;
         }  
         else {
             i=i-j+1;    j=0;
         }   
     }
     if (j>=T.length())  return (i-j);   
     else return -1;
}

KMP算法

算法：
在串S和串T中分别设比较的起始下标i和j；
2. 循环直到S中所剩字符长度小于T的长度或T中所有字符均比较完毕
2.1 如果S[i]==T[j]，继续比较S和T的下一个字符；否则
2.2 将j向右滑动到next[j]位置，即j=next[j]；
2.3 如果j=-1，则将i和j分别加1，准备下一趟比较；
3. 如果T中所有字符均比较完毕，则返回匹配的起始下标；否则返回-1；

int KMP_FindPat(char *s, char *t,int *next){
	int i=0,j=0,k;
	while(s[i]!='\0' && t[j]!='\0')	{
		if(j==-1 || s[i]==t[j])	{
                 i++;
                 j++;
           }
		else
		      j=next[j];
	}
	if(t[j]=='\0')
		return i-j;
	else
		return -1;
}

4.3多维数组

（多维）数组——线性表中的数据元素可以是线性表，但所有元素的类型相同。
数组定义：
数组是由一组类型相同的数据元素构成的有序集合，每个元素受n(n≥1)个线性关系的约束，并称该数组为 n 维数组。
数组特点：
元素本身可以具有某种结构，属于同一数据类型；
数组是一个具有固定格式和数量的数据集合。
二维数组是数据元素为线性表的线性表。
二维数组的存储结构与寻址：
常用的两种映射方法：
按行优先：先行后列，先存储行号较小的元素，行号相同者先存储列号较小的元素。
按列优先：先列后行，先存储列号较小的元素，列号相同者先存储行号较小的元素。
按行优先存储的寻址：
a_ij前面的元素个数=整行数×每行元素个数+本行中aij前面的元素个数=(i -l₁)×(h₂ -l₂＋1)＋(j -l₂)
则，Loc(a_ij)＝Loc(a_l1l2)＋((i－l₁)×(h₂－l₂＋1)＋(j－l₂))×c
按列优先存储的寻址：
LOC ( i, j ) = a + ( j *n +i ) * l
n维数组：
各维元素个数为 m₁, m₂, m₃, …, m_n
下标为 i₁, i₂, i₃, …, i_n的数组元素的存储地址：
LOC ( i₁, i₂, …, i_n ) = a +
( i₁*m₂m₃…*m_n + i₂*m₃m₄…*m_n+

……+ i_n-1*m_n + i_n ) * l

4.4矩阵的压缩存储

特殊矩阵：矩阵中很多值相同的元素并且它们的分布有一定的规律。
稀疏矩阵：矩阵中有很多零元素。
压缩存储的基本思想是：
⑴ 为多个值相同的元素只分配一个存储空间；
⑵ 对零元素不分配存储空间。

特殊矩阵的压缩存储——对称矩阵：

特点：a_ij=a_ji
从零开始：
a_ij在一维数组中的序号= i×(i+1)/2+ j+1
∵一维数组下标从0开始
∴a_ij在一维数组中的下标 k= i×(i+1)/2+ j
从一开始：
a_ij在一维数组中的序号 = i×(i-1)/2+ j
∵一维数组下标从0开始
∴a_ij在一维数组中的下标 k= i×(i-1)/2+ j-1
对于下三角中的元素a_ij(i≥j), 在一维数组中的下标k与i、j的关系为：
k＝i×(i-1)/2＋j-1 。
上三角中的元素a_ij（i＜j），因为a_ij＝a_ji，则访问和它对应的元素a_ji即可，即：
k＝j×(j-1)/2＋i -1。

特殊矩阵的压缩存储——三角矩阵：
存储：下三角元素+对角线上方的常数——只存一个
矩阵中任一元素aij在数组中的下标k与i、j的对应关系：
特殊矩阵的压缩存储——对角矩阵（带状矩阵）：
所有非零元素都集中在以主对角线为中心的带状区域中，除了主对角线和它的上下方若干条对角线的元素外，所有其他元素都为零。
二维数组法：
三元组顺序表：
将稀疏矩阵中的每个非零元素表示为：(行号，列号，非零元素值)——三元组
定义三元组：

template <class T>
struct element
{    
    int row, col;     //行号，列号
    T item              //非零元素值
};

三元组表：将稀疏矩阵的非零元素对应的三元组所构成的集合，按行优先的顺序排列成一个线性表。
存储结构定义：

const int MaxTerm=100;
    template <class T>
    struct SparseMatrix
    {
       T data[MaxTerm];   //存储非零元素
       int mu, nu, tu;           //行数，列数，非零元个数
    };

十字链表：
采用链接存储结构存储三元组表，每个非零元素对应的三元组存储为一个链表结点，结构为：
在这里插入图片描述 row：存储非零元素的行号
col：存储非零元素的列号
item：存储非零元素的值
right：指针域，指向同一行中的下一个三元组
down：指针域，指向同一列中的下一个三元组
定义：

template<class T>
class OLNode
{
	
public:
	int row,col;
	T element;
	OLNode<T>* right,*down;
public:
	OLNode(){right=NULL;down=NULL;};
};

4.5广义表

广义表（列表）： n ( >= 0 )个表元素组成的有限序列，记作：
LS = (a₀, a₁, a₂, …, a_n-1)
LS是表名，a_i是表元素，它可以是表 (称为子表)，可以是数据元素(称为原子)。
n为表的长度。n = 0 的广义表为空表。
长度：广义表LS中的直接元素的个数；
深度：广义表LS中括号的最大嵌套层数。
表头：广义表LS非空时，称第一个元素为LS的表头；
表尾：广义表LS中除表头外其余元素组成的广义表。

广义表和线性表的区别：
线性表的成分都是结构上不可分的单元素
广义表的成分可以是单元素，也可以是有结构的表
线性表是一种特殊的广义表
广义表不一定是线性表，也不一定是线性结构

广义表的存储结构——头尾表示法
结点结构：
在这里插入图片描述 tag：区分表结点和元素结点的标志；
hp：指向表头结点的指针；
tp：指向表尾结点的指针；
data：数据域，存放单元素。
定义结点结构：

enum Elemtag {Atom, List}; 
template <class T>
struct GLNode {  
   Elemtag tag; 
   union    {
      T data; 
      struct 
      {
          GLNode *hp, *tp; 
       } ptr;                            
    };
};

广义表特点：
有次序性：一个直接前驱和一个直接后继
有长度：等于表中元素个数
有深度：等于表中括号的重数
可递归：自己可以作为自己的子表
可共享：可以为其他广义表所共享

BianchiHB

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
第四章字符串和多维数组

4.2字符串串：零个或多个字符组成的有限序列。串长度：串中所包含的字符个数。空串：长度为0的串，记为：" “。非空串通常记为：S=” s1 s2 …… sn "其中：S是串名，双引号是定界符，双引号引起来的部分是串值，si（1≤i≤n）是一个任意字符。子串：串中任意个连续的字符组成的子序列。主串：包含子串的串。子串的位置：子串的第一个字符在主串中的序号。顺序串：用数组来存储串...
复制链接

扫一扫