数组与字符串

最新推荐文章于 2024-07-26 20:40:25 发布

liu_wenbin

最新推荐文章于 2024-07-26 20:40:25 发布

阅读量488

点赞数 1

分类专栏：数据结构与算法分析系列文章标签：数据结构数组字符串

本文链接：https://blog.csdn.net/liu_wenbin/article/details/65935974

版权

数据结构与算法分析系列专栏收录该内容

9 篇文章 0 订阅

订阅专栏

大家都知道什么是数组与字符串，这里不再累述。重点放在数据结构相关的一些技巧和问题的总结上。

请注意，数组问题与字符串问题往往是相通的。很多数组问题都可以以字符串的形式出现，反之亦然。

散列表

散列表（Hash table，也叫哈希表），是根据键（Key）而直接访问在内存存储位置的数据结构。也就是说，它通过计算一个关于键值的函数，将所需查询的数据映射到表中一个位置来访问记录，这加快了查找速度。这个映射函数称做散列函数，存放记录的数组称做散列表。
下面是一段使用散列表的简单Java程序：

public HashMap<Integer, Student> buildMap(Student[] students) {
    HashMap<Integer, Student> map = new HashMap<>();
    for(Student s : students) {
        map.put(s.getId(), s);
    }
    return map;
}

提到了散列表，就不得不提一下如何解决hash冲突。

解决hash冲突主要有三种方法：

1，开放地址法

开放地执法有一个公式:Hi=(H(key)+di) MOD m i=1,2,…,k(k<=m-1)
其中，m为哈希表的表长。di 是产生冲突的时候的增量序列。
（1）如果di值可能为1,2,3,…m-1，称线性探测再散列。
（2）如果di取1，则每次冲突之后，向后移动1个位置.如果di取值可能为1,-1,2,-2,4,-4,9,-9,16,-16,…k*k,-k*k(k<=m/2) 称二次探测再散列。
（3）如果di取值可能为伪随机数列。称伪随机探测再散列。

2，再哈希法

当发生冲突时，使用第二个、第三个、哈希函数计算地址，直到无冲突时。缺点：计算时间增加。

3，链表法

将所有散列地址相同的元素存储在同一线性链表中。（例如Java中jdk1。8版本以前的HashMap。）
这里写图片描述

ArrayList（动态数组）

ArrayList是一种按需要动态调整大小的数组，数据的访问时间复杂度为O(1)。但是数据的插入操作的开销很大（需要大量插入操作用LinkedList）。虽然每次扩容时的时间开销是O(n)，但是这种操作频率极少，因此均摊下来，访问数组元素的时间复杂度仍然为O(1)。
简而言之，ArrayList就是Array的复杂版本，它提供了如下一些好处：

动态的增加和减少元素
实现了ICollection和IList接口
灵活的设置数组的大小

StringBuffer和StringBuilder

String 字符串常量
StringBuffer 字符串变量（线程安全）
StringBuilder 字符串变量（非线程安全）
简单来说， String 类型和 StringBuffer 类型的主要性能区别其实在于 String 是不可变的对象, 因此在每次对 String 类型进行改变的时候其实都等同于生成了一个新的 String 对象，然后将指针指向新的 String 对象，所以经常改变内容的字符串最好不要用 String ，因为每次生成对象都会对系统性能产生影响，特别当内存中无引用对象多了以后， JVM 的 GC 就会开始工作，那速度是一定会相当慢的。
而如果是使用 StringBuffer 类则结果就不一样了，每次结果都会对 StringBuffer 对象本身进行操作，而不是生成新的对象，再改变对象引用。所以在一般情况下我们推荐使用 StringBuffer ，特别是字符串对象经常改变的情况下。而在某些特别情况下， String 对象的字符串拼接其实是被 JVM 解释成了 StringBuffer 对象的拼接，所以这些时候 String 对象的速度并不会比 StringBuffer 对象慢。

特别的：以下的字符串对象生成中， String 效率是远要比 StringBuffer 快的：
String S1 = “This is only a” + “ simple” + “ test”; StringBuffer Sb = new StringBuilder(“This is only a”).append(“ simple”).append(“ test”);
你会很惊讶的发现，生成 String S1 对象的速度简直太快了，而这个时候 StringBuffer 居然速度上根本一点都不占优势。其实这是 JVM 的一个把戏，在 JVM 眼里，这个：
String S1 = “This is only a” + “ simple” + “test”;
其实就是：
String S1 = “This is only a simple test”;
所以当然不需要太多的时间了。但大家这里要注意的是，如果你的字符串是来自另外的 String 对象的话，速度就没那么快了，譬如：
String S2 = “This is only a”;
String S3 = “ simple”;
String S4 = “ test”;
String S1 = S2 +S3 + S4;

这时候 JVM 会规规矩矩的按照原来的方式去做

在大部分情况下 StringBuffer > String
StringBuffer线程安全的可变字符序列。一个类似于 String 的字符串缓冲区，但不能修改。虽然在任意时间点上它都包含某种特定的字符序列，但通过某些方法调用可以改变该序列的长度和内容。
可将字符串缓冲区安全地用于多个线程。可以在必要时对这些方法进行同步，因此任意特定实例上的所有操作就好像是以串行顺序发生的，该顺序与所涉及的每个线程进行的方法调用顺序一致。
StringBuffer 上的主要操作是 append 和 insert 方法，可重载这些方法，以接受任意类型的数据。每个方法都能有效地将给定的数据转换成字符串，然后将该字符串的字符追加或插入到字符串缓冲区中。append 方法始终将这些字符添加到缓冲区的末端；而 insert 方法则在指定的点添加字符。
例如，如果 z 引用一个当前内容是“start”的字符串缓冲区对象，则此方法调用 z.append(“le”) 会使字符串缓冲区包含“startle”，而 z.insert(4, “le”) 将更改字符串缓冲区，使之包含“starlet”。

在大部分情况下 StringBuilder > StringBuffer
StringBuilder一个可变的字符序列。此类提供一个与 StringBuffer 兼容的 API，但不保证同步。该类被设计用作 StringBuffer 的一个简易替换，用在字符串缓冲区被单个线程使用的时候（这种情况很普遍）。如果可能，建议优先采用该类，因为在大多数实现中，它比 StringBuffer 要快。两者的方法基本相同。