数据结构和算法(顺序表)

本文深入探讨了计算机内存模型,强调了内存是按字节为单位进行地址标记的。接着介绍了顺序表的概念,特别是对于整型和字符型数据在内存中的存储方式。顺序表的基本形式是数据元素连续存储,可以通过起始地址和存储单元大小快速定位元素。文章还比较了一体式和分离式顺序表结构的优缺点,讨论了数据扩充的两种策略——线性增长和容量翻倍。
摘要由CSDN通过智能技术生成

现在看一下,对于整型数据int = 1,2,3,4,5(基本数据类型),对于这部分数据该怎么保存呢?抛弃掉高级数据类型(列表,字典等这些python这些封装好的数据结构),只记得整型、浮点型、字符型等基本数据类型。那么对于int=1,2,3,4,5这部分数据该怎么保存呢?首要的一点是要知道数据存贮的本质是什么?

内存

计算机的内存是存储数据并直接与CPU打交道的。既然是内存,那就是存储单元了,即组织在一起的一些单位。那么内存到底是什么样子的模型呢?内存的基本单位是以一个字节为作为索引单位的,且一个字节是8位。也就是在找数据的时候,标地址的时候是以一个字节为单位进行标记的。
在这里插入图片描述
上表表示计算机找数据的一个存储位置,比如告诉计算机有一个数据存的100,那么计算机的CPU需要去内存中去找,内存是一个连续的存储空间,假设100存储的位置如上表所示,那么我们需要告诉计算机或者CPU要去哪个位置去找这个100,那么我们需要对内存空间标注位置,如上表所示,我们只需要告诉计算机100所处的位置在0x03处,那么计算机就可以通过地址来找到数据100。计算机在是根据存储单元来标识的,在存储数据时,就需要多个存储单元,

如果有一个基本类型整型,那么它需要多少存储单元呢?对于32位机的化,基本整型需要4个字节,虽然有一个整数int = 1,但是在内存中需要转化为二进制进行存储的,结果为0000 0001(8位),而一个整型包含4个字节,则二进制后的值是0000 0000 0000 0000 0000 0000 0000 0001。其存储方式如下表所示
在这里插入图片描述
注:上表中的元素0和1因分布在表格中,这里为了方便没有一一对应
我们看到的是一个整型变量int=1,它落实在计算机内部的时候,实际上占了4个存储单元。

对于另外一种数据类型Char,字符串中的一个字符,且这1个字符需要占1个存储单元。那么问题就来了,类型不同,用的存储空间也不一样。 这是类型的第一个本质,他决定你在内存中利用多少个存储单元;第二个从取的角度考虑,即计算法在取二进制数据的时候,怎么看待它的问题,若是整型,那么取出的32位二进制就表示一个整型数据,而如果二进制表示的是4个字符(char),那么该二进制就表示了4个字符,所以不能一概而论。

顺序表

对与一组数据,比如整型数据int = 1,2,3,这三个整数是一个集合,然后想把它做成一个高级的数据类型,然后想把这三个数据存储起来,比如下图中的方框表示1,2,3的存储单元,比如第一个变量存储的是1,第二个变量存储的是2,第三个变量存储的是3,并且每一个方框的存储方式的展开都如上表所示(4个字节,32位),
在这里插入图片描述
通常情况下上面的三个存储单元是没有任何关系的。只代表了整型数据的一种存储方式。但是对于相关联的一组数据,该怎么存储呢?最直观的就是将它们连续的进行存储。
在这里插入图片描述
如上表所示,假如对于封装的高级数据结构Li=[3,21,37],即将数据在内存总进行连续存储,对于数据结构Li,它有起始位置,在本例中的起始位置为0x01,那么要找该集合中的第三个位置的元素,该怎么取呢?因为数据是连续存放的,所以是不是就可以根据第一个位置的地址找到第三个位置的地址所在啊,又因为该集合的每一个元素都是整型数据,即存储单元都是一样的,即如上表所示,第一个位置的地址与第二个位置的地址相差4个字节,第二个位置和第三个位置同样也相差4个字节,所以通过一次计算,通过第一个元素的地址便可以找到该集合中的所有元素位置。

顺序表的基本形式

在这里插入图片描述
图a表示的是顺序表的基本形式,数据元素本身连续存储,每个元素所占的存储单元大小固定相同,元素的下标是其逻辑地址,而元素的物理地址(实际内存地址)可以通过储存区的其实地址Loc( e 0 e_{0} e0)加上逻辑地址(第i个元素)与存储单元大小(c)的乘积计算而得,即:
Loc( e j e_{j} ej) = Loc( e 0 e_{0} e0) + c * j
故,访问指定元素不需要从头遍历,通过计算便可获得对应地址,其时间复杂度为O(1)。

如果元素的大小不同意,则徐采用图b的元素外置的形式,将实际数据元素另行存储,而顺序表中各单元位置保存对应元素的地址信息(即链接)。由于每个链接所需要的存储量相同,通过上述公司,可以计算出元素链接的存储位置,而后顺着链接找到实际存储的数据元素。注意,图b中的c不再是数据元素的大小,而是存储的一个链接地址所需要的存储量,这个量通常很小。

顺序表的结构与实现

顺序表的结构

在这里插入图片描述
一个顺序表的完整信息包括两部分,一部分是表中的元素集合,另一部分是为实现正确操作而需记录的信息,即有关表的整体情况的信息,这部分信息包括元素储存区的容量和当前表中已有的元素个数两项。

在构建顺序表的时候,一开始就需要吧数据存储的连续空间一次性拿到,即实现预估该顺序表需要存储多少数据。容量表示该顺序表可以存储的容量大小,元素个数表示该顺序表已经储存的元素。

那么该怎么将表头信息与数据区域进行链接呢?

顺序表的两种基本实现方式

在这里插入图片描述
在这里插入图片描述
图a为一体式结构,存储表信息的单元与元素存储区以连续的方式安排在一块存储区里,两部分数据的整体形成一个完整的数序表对象。

一体式结构整体性强,易于管理。但是由于数据元素存储区域是表对象的一部分,顺序表建立后,元素存储区就固定了。

图b为分离式结构,表对象只保存与整个表相关的信息(即容量和元素个数),实际数据元素存放在另一个独立的元素储存区里,通过链接与基本表对象关联。

对于上面两种顺序表的结构都是可以的,现在讨论下这两种顺序表构建结构谁优谁劣的问题

首先,针对两种顺序表的结构,先分析两种顺序表的结构原理。对于一体式结构,表头信息和数据区是连续一体的,即通过表头的地址经过偏离就可以找到数据区的数据存储的地址,从而找到该数据;对于分离式结构,表头信息和数据区是分离的,而且表头信息除了有容量各元素个数以外,还有一个地址单元,用于存储数据区域的一个元素的存储地址,从而通过表头信息的第一个地址找到第一个数据的地址,然后在根据地址偏移就可以找到所有数据的地址,从而找到所有的数据。

那么两种结构都具有一个表头信息,且包括容量这个概念,假设在扩充数据的时候,原来是的表中的容量变得不够用了,对于一体式结构,原来的容量不够用了,只能整体去替换,即重新项操作系统申请,使得申请后的内存可以满足扩充的需求,并且申请后的内存数据地址又是新的,和之前不一样且会出现新的表头信息及表头地址也将变化,而原来的内存将会被释放。对于分离式结构,虽然新申请的数据区域内存地址变化了,类似于一体式结构,但是表头的地址却没有变,只需要将表头信息的地址单元指向新的内存地址就可以了,这是一体式和分离式在数据扩展时主要的区别。

所以,在顺序表的构建中,主要使用的是分离式结构。

在构建顺序表时,需要实现对顺序表的容量进行预估,在数据扩充时,需要进行元素存储区的替换,具体就是,一体式结构由于顺序表信息区与数据区连续存储在一起,所以若想更换数据区,则只能整体搬迁,即整个顺序表对象(指存储顺序表的结构信息的区域)改变了

分离式结构若想更换数据区,只需要将表信息区的数据区链接地址更新即可,而该顺序表对象不变。

元素存储区扩充

采用分离式结构的顺序表,若将数据去更换为u存储空间更大的区域,则可以在不改变表对象的前提下对其数据存储区进行了扩充,所有使用这个表的地方都不必修改,只要程序的运行环境(计算机系统)还有空闲存储,这种表结构就不会因为满了而导致操作无法运行,人们把采用这种技术实现的顺序表称为动态顺序表,因为其容量乐意在使用中动态变化。

扩充的两种策略

每次扩充增加固定数目的存储位置,如每次扩充增加10各元素位置,这种策略可称为线性增长。
特点:节省空间,但是扩充操作频繁,操作次数多
每次扩充容量加倍,如每次扩充增加一倍存储空间,
特点:减少了扩充操作的执行次数,但可能会浪费空间资源,以空间换时间,推荐的方式。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值