底层数据结构

 

二进制:

二进制是计算技术中广泛采用的一种数制二进制数据是用0和1两个数码来表示的数。它的基数为2,进位规则是“逢二进一”,借位规则是“借一当二”,由18世纪德国数理哲学大师莱布尼兹发现。当前的计算机系统使用的基本上是二进制系统

======================================================================================================

比特:

两个概念

  1) 计算机专业术语,是信息量单位,是由英文BIT音译而来。二进制数的一位所包含的信息就是一比特,如二进制数0100就是4比特。

  2)二进制数字中的位,信息量的度量单位,为信息量的最小单位。数字化音响中用电脉冲表达音频信号,“1”代表有脉冲,“0”代表脉冲间隔。如果波形上每个点的信息用四位一组的代码表示,则称4比特,比特数越高,表达模拟信号就越精确,对音频信号还原能力越强。

计算机中的位

  二进制数系统中,每个0或1就是一个位(bit),位是数据存储的最小单位。其中8bit就称为一个字节(Byte)。计算机中的CPU位数指的是CPU一次能处理的最大位数。例如32位计算机的CPU一次最多能处理32位数据。

======================================================================================================

字节:

字节(Byte)是计算机信息技术用于计量存储容量和传输容量的一种计量单位,1个字节等于8位二进制,也就是一个字节等于8个比特位!

字节(Byte 发音:/‘bait/):字节是通过网络传输信息(或在硬盘内存中存储信息)的单位。

  在ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。

  符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小

也就是说:在ASCII码中,英文字符和符号都占一个字节,中文汉字和符号都占两个字节。

一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值:0 最大值:255 。如一个ASCII码就是一个字节,此类单位的换算为:

  1KB(Kilobyte 千字节)=1024B,

  1MB (Megabyte 兆字节 简称“兆”)=1024KB,

        1GB=1024MB

======================================================================================================

unicode

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。Unicode用数字0-0x10FFFF来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位。码位就是可以分配给字符的数字。UTF-8、UTF-16、UTF-32都是将数字转换到程序数据的编码方案。

在Unicode中:汉字“字”对应的数字是23383。

=====================================================================================================

utf-8

UTF-8编码的最大长度是4个字节。从上表可以看出,4字节模板有21个x,即可以容纳21位二进制数字。Unicode的最大码位0x10FFFF也只有21位。

UTF-8以字节为单位对Unicode进行编码。即unicode是对每个位进行编码,utf-8是对8个比特位进行编码,因此utf-8(8个比特)

从Unicode到UTF-8的编码方式如下:

  Unicode编码(16进制) ║ UTF-8 字节流(二进制)

  000000 - 00007F ║ 0xxxxxxx

  000080 - 0007FF ║ 110xxxxx 10xxxxxx   

  000800 - 00FFFF ║ 1110xxxx 10xxxxxx 10xxxxxx

  010000 - 10FFFF ║ 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

如果UNICODE字符由2个字节表示,则编码成UTF-8很可能需要3个字节,而如果UNICODE字符由4个字节表示,则编码成UTF-8可能需要6个字节。

=========================================================================================================

GBK

用双字节表示汉字

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在计算机科学中,Map(也称为哈希表或关联数组)是一种常见的数据结构,它用于存储键值对,提供了快速查找、插入和删除元素的能力。它的底层数据结构通常有以下几种实现: 1. **开放寻址法**:当发生冲突(即两个不同的键映射到同一个位置)时,会寻找下一个空闲的位置,如线性探测(Linear Probing)、二次探测(Quadratic Probing)或双散列(Double Hashing)。 2. **链地址法**:每个位置存储一个链表节点,链表中的每个节点包含键值对。当发生冲突时,新键值对被添加到相应键的链表中。 3. **分块(Bucket)数组**:将整个数据空间划分为多个大小相同的块,每个块内部使用上述的开放寻址或链地址法解决冲突。 4. **红黑树**:在某些实现中,尤其是那些追求更高效的平衡查找性能的,可能会选择使用自平衡二叉查找树,如红黑树,来作为底层数据结构。 5. **哈希表数组**:这是最常见的实现方式,它由一个固定大小的数组和额外的数据结构(如链表或开放地址数组)组成,用于处理哈希冲突。 Map的具体实现取决于编程语言和库的选择,例如C++的`std::unordered_map`通常使用开放寻址法,而Java的`HashMap`则使用链地址法。不同的实现会影响性能,如查找速度、空间效率和冲突处理策略。如果你有特定编程语言背景的问题,我可以提供更详细的解释。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值