golang 数组组合成最小的整数_用Go写算法：求最小可用自然数

最新推荐文章于 2022-03-28 10:18:46 发布

weixin_39882870

最新推荐文章于 2022-03-28 10:18:46 发布

阅读量135

点赞数

文章标签： golang 数组组合成最小的整数

本文链接：https://blog.csdn.net/weixin_39882870/article/details/111558845

版权

前言

前一段时间在 reddit 上看到有人推广一篇名为 GopherCon 2018 - Demystifying Binary Search Tree Algorithms 的博客，

博客中列举了传统大学里学习算法的种种弊端，并强调了用 Go 实现算法是多么简单有趣，然后拿二叉树举了个例子。读完这篇博客以后，我不得不说，真心没看出来 Go 写算法的优势在哪里。但是，配图确实萌翻了，下面盗图一副。

虽然不太信服，还是抱着试试看的心态 Go 做了一些算法实现的尝试。这里我从 "Pears of Functional Algorithms Design" 里拿了一道题：给定一个无序自然数数组 A，求出不在 A 中的最小自然数，约束条件如下：

A 中的元素个数是有限的，每个元素都是自然数，并且互不相同(自然数包含 0 和正整数)。

假设 A 中元素的大小在 [0, inf] 之间。

Note: 由于计算机本身的限制，我们这里假设 inf = 2^31-1

举几个例子：

A = [1,2,9,4], output = 0

A = [0,1,2], output = 3

A = [0,1,16,8,4,2], output = 3

A = [], output = 0

首先我们声明一个函数来表述这个问题：

func f(A []int) int

然后，我们思考如何解决这个问题。

此处建议思考两分钟，如果身边有笔有纸，建议写写画画。

方案一

首先映入脑海的方法是：声明一个 bool 数组 B，将 A 中元素作为下标，将 B 对应的元素置为 true，遍历 B，返回第一个 false 的下标。这个方法显然不靠谱，在某些条件下，它会使用大量内存。为了更直观，这里把具体实现贴出来：

func f(A []int) int {

maxElem := max(A) // 函数 max 用于获取数组的最大值

B := make([]bool, maxElem+1, maxElem+1)

for _, elem := range A {

B[elem] = true

}

for idx, val := range B {

if !val {

return idx

}

return -1 // compile error without it

}

在极限情况下，例如 A = [2^31-1]，上面代码中 B 会占用 (2^31-1)/8 ≈ 2^28 byte = 256 Mbyte 内存，显然很不合理。

方案二：引入排序函数

如果引入一个库函数呢，比如 sort。先用 sort 给 A 排序，然后从 0 开始递增，找到第一个不在 A 中的元素。这个方法可以解决问题，假设 n=len(A)，排序时间 O(nlogn), 检索效率 O(n)。我们看一下代码实现：

func f(A []int) int {

sort.Ints(A)

for idx, val := range A {

if idx != val {

return idx

}

return len(A)

}

这是一个很常规的方法。这里的实现有两个地方需要注意：

if idx != val 避免了创建额外一个变量和对其进行管理的成本

return len(A) 优雅地处理了边界情况

但是引入 sort 的代价也很明显：O(nlogn) 的时间复杂度比较高。有没有时间复杂度为 O(n) 的方法呢？

我们再次思考这个问题本身。对于乱序状态下的 A，对于 [0, inf] 的每一个自然数，搜索的耗时都是 O(n)，最多搜索 n 个自然数。要达到总体复杂度为 O(n)，一个方法是将搜每个自然数搜索的耗时降低到 O(1)，另一个方法是只搜索 O(1) 个自然数。后一个方法看起来有点难以实现，但是前一个方法只需要我们引入一个 hashmap。

而 Go 语言内置的 map 就是基于 hashmap。

方案三：引入 map

引入 map 以后，大致步骤是：

遍历 A，填充 map。时间和空间复杂度都是 O(n)

遍历 [0, inf]，找到第一个不在 map 中的元素

代码如下：

func f(A []int) int {

mapping := make(map[int]struct{}, len(A))

for _, val := range A {

mapping[val] = struct{}{}

}

for i := 0; ; i++ {