数据结构——字符串和多维数组

4 章  字符串和多维数组

本章的基本内容是:

     字符串。在程序设计语言中大都有串变量的概念,而且实现了基本的串操作,本章重点讨论串的存储结构及模式匹配算法。
     数组。在程序设计语言中大都提供了数组作为构造数据类型,本章重点讨论数组以及特殊矩阵的存储与寻址。

 4.1  字符串

主要内容
4.11  字符串的定义
4.12  字符串的存储结构
4.13  模式匹配
 

线性表——具有相同类型的数据元素的有限序列。

——仅在表的一端进行插入和删除操作。

队列——在一端进行插入操作,而另一端进行删除操作。

——零个或多个字符组成的有限序列。

线性表——具有相同类型的数据元素的有限序列。

(多维)数组——线性表中的数据元素可以是线性表。


串的逻辑结构:

p串:零个或多个字符组成的有限序列
p 串长度:串中所包含的字符个数。
p 空串:长度为0的串,记为:" "。

p非空串通常记为:

     S=" s1 s2 …… sn "

其中:S是串名,双引号是定界符,双引号引起来的部分是串值 ,

si(1≤i≤n)是一个任意字符。

p 子串:串中任意个连续的字符组成的子序列。
p 主串:包含子串的串。
p 子串的位置:子串的第一个字符在主串中的序号。

                                       S1="ab12cd

                                       S2="ab12" 

                                       S3="ab13"

                                       S4="ab12φ"

                                       S5=" "

                                       S6="φφφ "


p串的数据对象约束为某个字符集。
p 微机上常用的字符集是标准ASCII码,由 7 位二进制数表示一个字符,总共可以表示 128 个字符。
p 扩展ASCII码由 8 位二进制数表示一个字符,总共可以表示 256 个字符,足够表示英语和一些特殊符号,但无法满足国际需要。
 Unicode由 16 位二进制数表示一个字符,总共可以表示 216个字符,能够表示世界上所有语言的所有字符,包括亚洲国家的表意字符。为了保持兼容性,Unicode字符集中的前256个字符与扩展ASCII码完全相同。  

串的比较:通过组成串的字符之间的比较来进行的。

给定两个串:X="x1x2xn"Y="y1y2ym",则:

1. n=mx1=y1xn=ym时,称X=Y

2. 当下列条件之一成立时,称XY

nmxi=yi(1≤ in);

存在kmin(m,n),使得xi=yi(1≤ik-1)xkyk


模式匹配:给定主串S="s1s2…sn"和模式T="t1t2…tm",在S中寻找T 的过程称为模式匹配。如果匹配成功,返回T 在S中的位置;如果匹配失败,返回0。

模式匹配问题有什么特点

⑴算法的一次执行时间不容忽视:问题规模通常很大,常常需要在大量信息中进行匹配;

⑵算法改进所取得的积累效益不容忽视:模式匹配操作经常被调用,执行频率高。

模式匹配——BF(Back-Forward?)算法 

1. 在串S和串T中设比较的起始下标ij;

2. 循环直到ST的所有字符均比较完

    2.1 如果S[i]=T[j],继续比较ST的下一个字符;

    2.2 否则,将ij回溯,准备下一趟比较;

3. 如果T中所有字符均比较完,则匹配成功,返回匹配的起始比较下标;

否则,匹配失败,返回0;

int BF(char S[ ], char T[ ])

{

     i=0; j=0;  

    while (S[i]!='\0'&&T[j]!='\0')

    {

         if (S[i]==T[j]) {

             i++;   j++;

         } 

         else {

             i=i-j+1;    j=0;

         }  

     }

     if (T[j]=='\0') return (i-j+1);  

     else return 0;

}

int BF(char S[ ], char T[ ])

{

     i=0; j=0;start=0;  

    while (S[i]!='\0'&&T[j]!='\0')

    {

         if (S[i]==T[j]) {

             i++;   j++;

         } 

         else {

             start++;  i=start;  j=0;

         }  

     }

     if (T[j]=='\0') return start;  

     else return 0;

}


KMP算法的伪代码描述

1. 在串S和串T中分别设比较的起始下标ij;

2. 循环直到ST的所有字符均比较完

     2.1 如果S[i]=T[j],继续比较ST的下一个字符;否则

     2.2 将j向右滑动到next[j]位置,即j=next[j];

     2.3 如果j=-1,则将ij分别加1,准备下一趟比较;

 3. 如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回0

  4.2  多维数组

主要内容
4.21  数组的定义
4.22  数组的存储结构与寻址

数组是由一组类型相同的数据元素构成的有序集合,每个数据元素称为一个数组元素(简称为元素),每个元素受n(n≥1)个线性关系的约束,每个元素在n个线性关系中的序号i1、i2、…、in称为该元素的下标,并称该数组为 n 维数组。 


数组的特点

元素本身可以具有某种结构,属于同一数据类型;
数组是一个具有固定格式和数量的数据集合。

数组的基本操作

⑴ 存取:给定一组下标,读出对应的数组元素;

⑵ 修改:给定一组下标,存储或修改与其相对应的数组元素。

存取和修改操作本质上只对应一种操作—— 寻址

  4.3  矩阵的压缩存储

主要内容
  4.31  对称矩阵的压缩存储
  4.32  三角矩阵的压缩存储
  4.33  对称矩阵的压缩存储
  4.34  稀疏矩阵的压缩存储

特殊矩阵和稀疏矩阵

p特殊矩阵:矩阵中很多值相同的元素并且它们的分布有一定的规律。
p 稀疏矩阵:矩阵中有很多零元素。

p压缩存储的基本思想是:

    ⑴ 为多个值相同的元素只分配一个存储空间;

  ⑵ 对元素不分配存储空间。


                     本章总结














  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值