基本数据结构和算法-CSDN博客

本文链接：https://blog.csdn.net/ipangci/article/details/133080657

基本数据结构和算法

1. 什么时候该用数组型容器、什么时候该用链表型容器？
2. 什么是散列函数？HashMap 的实现原理是什么？
3. 什么是递归？如果你以前从来没写过递归函数，尝试着写一个（比如用递归函数进行目录树遍历）。
4. 什么是算法复杂度？
5. 你是否理解空间换时间的思想？
6. 写一个针对整数数组的冒泡排序函数，看看你要修改几次才能跑通。
7. 写一个针对整数数组的二分查找函数，看看你要修改几次才能跑通。

1. 什么时候该用数组型容器、什么时候该用链表型容器？

在Java中，选择数组型容器（如ArrayList）还是链表型容器（如LinkedList）取决于以下因素：
使用数组型容器（ArrayList）的情况：

需要快速的随机访问元素： 如果需要通过索引快速访问集合中的元素，数组型容器是更好的选择。由于数组在内存中是连续存储的，可以通过索引直接访问元素，时间复杂度为O(1)。
需要高效的遍历操作： 当需要按顺序遍历集合中的元素时，数组型容器通常比链表型容器更高效。由于数组中的元素在内存中是连续存储的，可以通过循环遍历来高效访问每个元素，时间复杂度为O(n)。
需要频繁进行尾部添加或删除操作： ArrayList提供了尾部添加和删除元素的操作，这些操作的时间复杂度为O(1)。因此，如果需要频繁对集合的尾部进行操作，使用ArrayList更为高效。

使用链表型容器（LinkedList）的情况：

需要频繁的插入和删除操作： 链表型容器适用于频繁在中间位置插入或删除元素的情况。由于链表中的元素通过节点引用连接，插入和删除操作的时间复杂度为O(1)。
不需要频繁的随机访问元素： 链表的访问操作需要遍历链表来查找目标元素，时间复杂度为O(n)。因此，如果不需要频繁通过索引访问元素，而是更多地进行插入、删除或顺序访问操作，链表型容器可能更适合。
需要高效的头部和尾部操作： LinkedList对于头部和尾部的插入和删除操作效率较高，时间复杂度为O(1)。因此，如果需要经常在集合的头部或尾部进行操作，使用LinkedList可能更为高效。

需要注意的是，以上是一般情况下的建议，并非绝对规则。在具体的应用场景中，还需考虑集合大小、操作频率、内存占用、多线程安全等因素，以选择最适合的容器类型。此外，Java还提供了其他集合类，如HashSet、TreeSet、HashMap等，可以根据具体需求选择合适的集合类型。

2. 什么是散列函数？HashMap 的实现原理是什么？

散列函数（Hash Function）是一种将输入数据映射到固定大小的散列值（哈希值）的函数。它接受任意长度的输入，并通过计算产生一个固定长度的散列值。散列函数的设计目标是使得不同的输入数据产生不同的散列值，并尽可能均匀地分布在散列空间中，以减少散列冲突的概率。

HashMap是Java中常用的哈希表实现，它基于散列表（Hash Table）数据结构。HashMap的实现原理如下：

存储结构： HashMap内部使用数组（Node[]或Entry[]）来存储数据，数组中的每个元素称为桶（bucket）。每个桶存储一个键值对，其中键通过散列函数计算得到散列码（hash code），用于确定存储位置。
散列码计算： 当向HashMap中插入键值对时，首先对键对象的hashCode()方法进行调用，获取散列码。hashCode()方法在Object类中定义，可以被所有对象继承和使用。散列码可以是int类型的整数，代表了对象的特定标识。
桶的选择： 根据散列码计算出的索引值（通过取模运算得到），确定键值对存储在数组的哪个桶中。如果多个键值对计算得到相同的索引值，即产生了散列冲突，这些键值对将会以链表或红黑树的形式存储在同一个桶中。
散列冲突处理： 当多个键值对存储在同一个桶中时，HashMap使用链表或红黑树来解决散列冲突。在JDK 8之前，采用链表实现；而在JDK 8及以后的版本，当链表长度超过一定阈值时，会将链表转化为红黑树，以提高查找效率。
键的比较： 当需要查找或获取键值对时，HashMap会根据给定的键对象的hashCode()方法计算散列码，然后根据散列码找到对应的桶，最后再通过键对象的equals()方法进行比较，以确定具体的键值对。
动态扩容： 当HashMap中的元素数量达到一定阈值时，会触发扩容操作。扩容会创建一个更大容量的新数组，并将原有的键值对重新散列到新数组中，以保持散列性能的稳定。扩容操作会导致重新计算散列码和重新分配桶的位置，因此可能会带来一定的性能开销。

HashMap的实现原理充分利用了散列表的快速查找和插入特性，通过散列函数和散列冲突处理来实现高效的键值对存储和检索。它提供了平均时间复杂度为O(1)的查找、插入和删除操作，适用于大多数的键值对存储需求。

3. 什么是递归？如果你以前从来没写过递归函数，尝试着写一个（比如用递归函数进行目录树遍历）。

递归是一种在方法或函数中调用自身的编程技巧。递归函数通过将一个大问题分解为一个或多个相同或相似的子问题来解决问题，直到达到基本情况（递归终止条件）并返回结果。

下面是一个使用递归函数进行目录树遍历的示例，该程序将打印指定目录及其子目录下的所有文件和文件夹：

import java.io.File;

public class DirectoryTraversal {

    public static void traverseDirectory(File directory, String indent) {
        File[] files = directory.listFiles();  // 获取当前目录下的所有文件和文件夹
        
        if (files != null) {
            for (File file : files) {
                if (file.isFile()) {
                    // 如果是文件，则打印文件名
                    System.out.println(indent + file.getName());
                } else if (file.isDirectory()) {
                    // 如果是文件夹，则递归调用函数进行目录遍历
                    System.out.println(indent + "[" + file.getName() + "]");
                    traverseDirectory(file, indent + "  ");
                }
            }
        }
    }

    public static void main(String[] args) {
        File directory = new File("/path/to/directory");
        traverseDirectory(directory, "");
    }
}

在上述示例中，traverseDirectory方法接受一个File对象表示目录和一个缩进字符串参数。它首先获取目录下的所有文件和文件夹，然后遍历每个项。对于文件项，直接打印文件名；对于文件夹项，打印文件夹名，并通过递归调用traverseDirectory方法进入子目录进行遍历，同时传递更新后的缩进字符串。

要注意在编写递归函数时，需要考虑递归终止条件，以避免无限递归。在上述示例中，递归终止条件是当遍历到的项为文件时，不再进行递归调用。

4. 什么是算法复杂度？

算法复杂度（Algorithmic Complexity）是衡量算法执行效率的度量标准，用于描述算法运行时间或空间资源消耗随输入规模增加而变化的情况。算法复杂度通常包括时间复杂度和空间复杂度两个方面。

时间复杂度：时间复杂度是衡量算法在运行时所需的时间资源。它描述了算法执行时间随输入规模增长的增长率。常用的时间复杂度表示方法有大O符号（O）表示法。常见的时间复杂度从低到高排列包括：常数时间复杂度（O(1)）、对数时间复杂度（O(log n)）、线性时间复杂度（O(n)）、线性对数时间复杂度（O(n log n)）、平方时间复杂度（O(n^{2)）、立方时间复杂度（O(n}3)）、指数时间复杂度（O(2^n)）等。
空间复杂度：空间复杂度是衡量算法在执行过程中所需的额外空间资源。它描述了算法所使用的内存空间随输入规模增长的增长率。常用的空间复杂度表示方法同样采用大O符号（O）表示法。常见的空间复杂度从低到高包括：常数空间复杂度（O(1)）、线性空间复杂度（O(n)）、平方空间复杂度（O(n^2)）等。

算法复杂度的分析可以帮助我们评估和比较不同算法的效率，并选择最优的算法来解决特定问题。通常情况下，我们希望选择时间复杂度较低且空间复杂度较低的算法，以获得更高的执行效率和更少的资源消耗。然而，需要注意的是，算法复杂度只是一种理论上的估计，实际的执行时间和空间消耗还受到硬件环境、编译器优化等因素的影响。因此，在实际应用中，还需要综合考虑算法的复杂度与实际需求之间的平衡。

5. 你是否理解空间换时间的思想？

空间换时间的思想可以通过以下方式理解：

优化算法执行时间：在某些情况下，为了减少算法的执行时间，我们可以使用更多的空间资源。通过额外的空间来存储中间结果、预计算的数据或者建立索引，可以避免重复计算或加速数据访问，从而提高算法的执行效率。通过牺牲一部分空间资源，我们可以换取更快的运行速度。
缓存和索引的应用：空间换时间常常涉及使用缓存或索引来加速数据访问。通过将计算结果或频繁访问的数据存储在缓存或索引中，可以避免重复计算或进行更快的数据检索。这样，虽然需要占用额外的空间，但可以大大提高算法的执行效率。
权衡空间和时间：空间换时间需要在空间和时间之间进行权衡。在选择使用额外空间进行优化时，需要考虑可用的内存资源、算法的输入规模以及对执行时间的要求。适当的权衡可以使算法更加高效，但也需要避免过度使用空间而导致资源浪费。

总的来说，空间换时间的思想是通过利用更多的空间资源来减少算法的执行时间。通过使用缓存、索引或其他数据结构来存储中间结果或预处理的数据，可以避免重复计算和加快数据访问速度。然而，需要根据具体情况权衡空间和时间的使用，并确保在实际应用中获得明显的性能提升。

6. 写一个针对整数数组的冒泡排序函数，看看你要修改几次才能跑通。

下面是一个使用Java编写的冒泡排序函数示例：

public class BubbleSort {
    public static void bubbleSort(int[] array) {
        int n = array.length;
        for (int i = 0; i < n - 1; i++) {
            for (int j = 0; j < n - i - 1; j++) {
                if (array[j] > array[j + 1]) {
                    // 交换相邻元素
                    int temp = array[j];
                    array[j] = array[j + 1];
                    array[j + 1] = temp;
                }
            }
        }
    }

    public static void main(String[] args) {
        int[] array = { 5, 2, 8, 12, 1, 6 };
        bubbleSort(array);
        System.out.print("排序结果：");
        for (int num : array) {
            System.out.print(num + " ");
        }
    }
}

冒泡排序的核心思想是通过不断比较相邻的元素，并交换它们的位置，让较大（或较小）的元素逐渐"浮"到数组的一端。具体步骤如下：

从数组的第一个元素开始，依次比较相邻的两个元素。
如果前一个元素大于（或小于）后一个元素，交换它们的位置。
继续比较下一对相邻元素，重复步骤2。
重复执行步骤2和步骤3，直到没有元素需要交换，即数组已经有序。

在每一轮的比较过程中，最大（或最小）的元素会逐渐"浮"到数组的末尾。因此，冒泡排序的名称就来源于这个过程。

冒泡排序的时间复杂度为O(n^2)，其中n是数组的长度。它是一种简单但效率相对较低的排序算法，适用于小规模的数据集。

7. 写一个针对整数数组的二分查找函数，看看你要修改几次才能跑通。

下面是一个使用Java编写的二分查找函数示例：

public class BinarySearch {
    public static int binarySearch(int[] array, int target) {
        int left = 0;
        int right = array.length - 1;

        while (left <= right) {
            int mid = left + (right - left) / 2;

            if (array[mid] == target) {
                return mid; // 找到目标元素，返回索引
            } else if (array[mid] < target) {
                left = mid + 1; // 目标元素在右侧，更新左边界
            } else {
                right = mid - 1; // 目标元素在左侧，更新右边界
            }
        }

        return -1; // 目标元素不存在，返回-1
    }

    public static void main(String[] args) {
        int[] array = { 2, 5, 8, 12, 16, 23, 38, 56, 72, 91 };
        int target = 23;
        int index = binarySearch(array, target);
        if (index != -1) {
            System.out.println("目标元素 " + target + " 在索引 " + index + " 处找到。");
        } else {
            System.out.println("目标元素 " + target + " 不存在数组中。");
        }
    }
}

以上示例演示了如何使用二分查找算法在已排序的整数数组中查找目标元素。核心思想如下：

初始化左边界 left 为数组的起始位置，右边界 right 为数组的末尾位置。
在每一轮循环中，计算中间元素的索引 mid，通过 left + (right - left) / 2 计算。
比较中间元素 array[mid] 与目标元素 target 的值：
- 如果 array[mid] 等于 target，则找到目标元素，返回索引 mid。
- 如果 array[mid] 小于 target，则目标元素位于右侧，更新左边界 left 为 mid + 1。
- 如果 array[mid] 大于 target，则目标元素位于左侧，更新右边界 right 为 mid - 1。
重复执行步骤2和步骤3，直到找到目标元素或者 left 大于 right，表示目标元素不存在于数组中。
如果找到目标元素，返回其索引；否则，返回 -1 表示目标元素不存在。