大数据算法课程笔记2：2D Convex Hull

最新推荐文章于 2022-12-31 17:08:16 发布

silent56_th

最新推荐文章于 2022-12-31 17:08:16 发布

阅读量721

点赞数

分类专栏：大数据算法文章标签：大数据算法

本文链接：https://blog.csdn.net/silent56_th/article/details/78177262

版权

大数据算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1. 题目简介

Input: $n$ points in the plane $p_1,p_2,\cdots,p_n$ , where $p_i = (x_i,y_i)$

Output: 包含所有点的最小凸多边形的所有边

2. 基本思想：Divide and Conquer

先把点集一分为二，分别求取相应凸多边形，然后对两个凸多边形合并。

3. 具体算法

sort $P = \{p_i\}$ for $i = 1\cdots n$ , such that $x_1 < x_2 < \cdots x_n$
divide $P$ into $P_L$ and $P_R$ equally by picking the median of $X$ , $x_{median}$ . Then $P_L = \{p_i\}$ iff. $x_i < x_{median}$ , and $P_R = P - P_L$
After division, do it recursively.
Merge: that’s the difficult part and we will expand it in detail.

4. 融合两个凸多边形

这部分是对具体算法第四部分的展开。
输入是两个点集以及包含相应点集的最小凸多边形，且有两个点集的 $X$ 域不交叉，求一个 $O(N)$ 的融合算法。

讨论包含所有点的最小凸多边形的性质。笔者能够想到的最简单的方法就是枚举任意三个点，然后对所有三个点所构成的三角形取并集。
但这个算法明显是 $O(N$ ！ $)$ 的。如果能够找到一个比较好的切入点，就会大幅降低了算法复杂度。

如下图所示，黑色菱形为已经计算好的两个凸多边形。对两者进行融合，其实是去寻找合理的两条红边，只需要讨论红边应该具有什么性质即可。

这个性质很直接了，凸多边形应该包含点集里面的所有点，并且因为是凸多边形，即所有角度数小于180°。
综上所述，对于上面的红边，应该有点集里面的所有点都比红边低，否则比红边高的点将不会被包含在以红边为边的所有凸多边形内。
形式化上诉结论有：

min x m e d i a n * a + b s.t. x i * a + b \geq y i, for all i

$\min x_{median}*a+b \\ \text{s.t. } x_i *a + b \ge y_i, \text{ for all }i$
这是一个只有两个变量的线性规划问题，后面会解释，求解此问题复杂性为

O(N) $O(N)$ 。

得到红边之后，逐一比较 $x_i*a+b$ 和 $y_i$ ，若两者相等，则该点为凸多边形的顶点。

5. 整体算法的时间复杂度

如上所诉，有 $T(N) = T(N/2)+O(N)$ ，容易求解 $T(N) = O(NlogN)$ 。

6. 算法复杂性与数据性质的关系

若N极大，则复杂性为 $O(1)$ 。

证明：因为推广N到 $\inf$ ，则覆盖全域，凸多边形为包含全域的凸多边形。
若已知最终的凸多边形的边数一定，为 $h$ 。则复杂性最终为 $O(N\log h)$ 。

证明：将求解凸多边形问题转换为求解凸多边形所有边的问题，进而可以将其转换为求解凸多边形上边和下边的问题。

易证凸多边形的顶点中必然存在 $(x_1,y_1)$ 和 $(x_N,y_N)$ ，其中 $x_1 = min(x), x_N = max(x)$ 。然后对凸多边形的边根据 $p_{min}$ 和 $p_{max}$ 进行划分，分为上边集和下边集，上边集和下边集交集为NULL，并集为所有边，上边位于所有下边上方。如下图所示，红边为上边，黑边为下边。

上边和下边的数目最多为 $h$ ，现计算求解上边集的算法复杂性。

$T(N,h) = T(N/2,h_1)+T(N/2,h_2)+O(N)$ ，其中 $h = h_1+h_2+1$ 。

假设 $T(N,h) = O(Nlog h)$ ，使用归纳法即可验证。

T (N, h) = C N 2 log (h 1) + C N 2 log (h 2) + O (N) = C N 2 log (h 1 h 2) + O (N) \leq C N 2 log (h 2 4) + O (N) \leq C N (log h - 1) + O (N) \leq C N log h iff. C is big enough

$T(N,h) = C\frac{N}{2}\log(h_1)+C\frac{N}{2}\log(h_2)+O(N) ~~~~~ \\ = C\frac{N}{2}\log(h_1h_2)+O(N) ~~~~~~~~~~~~\\ \le C\frac{N}{2}\log(\frac{h^2}{4})+O(N)~~~ ~~~~~~~~~~~~\\ \le CN(\log h-1)+O(N) ~~~~~~~~~~~~\\ \le CN\log h \text{ iff. C is big enough }~~$

silent56_th

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据算法课程笔记2：2D Convex Hull

1. 题目简介Input: nn points in the plane p1,p2,⋯,pnp_1,p_2,\cdots,p_n, where pi=(xi,yi)p_i = (x_i,y_i)Output: 包含所有点的最小凸多边形的所有边2. 基本思想：Divide and Conquer先把点集一分为二，分别求取相应凸多边形，然后对两个凸多边形合并。3. 具体算法sort P={pi}P
复制链接

扫一扫