Coursera - Algorithm (Stanford) - 课程笔记 - Week 3

最新推荐文章于 2024-08-22 17:27:46 发布
支锦铭
最新推荐文章于 2024-08-22 17:27:46 发布
阅读量195
点赞数
分类专栏： Cousera-课程笔记文章标签：算法
本文链接：https://blog.csdn.net/cary_leo/article/details/105898353
版权
Cousera-课程笔记专栏收录该内容
141 篇文章 17 订阅
订阅专栏
                    
                    Quicksort - Algorithm 
关键思想：在枢轴两侧划分数组（左小右大），因此需要重点考虑枢轴的选择
两个关于划分的有趣事实 
  线性时间完成操作（ 
        
            O 
           
            ( 
           
            n 
           
            ) 
           
           O(n) 
          
       O(n)），且不需要额外内存
减小了问题的尺寸（应用分治法的关键）
 
基本算法过程 
  如果当前子问题处理的长度为1，返回
否则 
    令p为当前子问题的序列的枢轴
将当前问题的序列划分到枢轴的两侧
对枢轴的两侧分别进行递归
 
划分的原位实现： 
  以下假设枢轴量已经位于数组的第一个位置上（通过调整到达）
单次扫描：已经扫描过的内容必是已经划分好的
 
划分算法简述： 
  输入：数组A，给定边界坐标l，r
确定枢轴p := A[l]
初始化划分检查坐标i := l + 1
for j = l + 1 to r： 
    if A[j] < p： 
      swap A[j] and A[i]
i := i + 1
 
swap A[l] and A[i - 1]
 
运行时间复杂度： 
      
          O 
         
          ( 
         
          n 
         
          ) 
         
         O(n) 
        
     O(n)，其中 
      
          n 
         
         n 
        
     n为当前子问题的数组的长度
快排算法的正确性独立于对枢轴选择的方法之不同
快排的效率极大地依赖枢轴的选择方式 
  最糟糕情况（序列完全有序，枢轴取最小） 
        
            O 
           
            ( 
           
             n 
            
             2 
            
            ) 
           
           O(n^2) 
          
       O(n2)
最好情况（序列随机，枢轴取中间值） 
        
            O 
           
            ( 
           
            n 
           
            log 
           
            ⁡ 
           
            n 
           
            ) 
           
           O(n \log n) 
          
       O(nlogn)
 
枢轴的选的方法 
  随机枢轴：等概率挑选
如果能够做到25-75的分割，这样的枢轴已经足够好
如果超过半数的枢轴选择能够给出一个25-75的分割，已经很好
 
平均运行时间：对n长度的数组（随机），平均运行时间为 
      
          O 
         
          ( 
         
          n 
         
          log 
         
          ⁡ 
         
          n 
         
          ) 
         
         O(n \log n) 
        
     O(nlogn)
 
Quicksort - Analysis 
前提： 
  固定一个长度n的数组A
采样空间Ω：所有可能的枢轴选择
关键随机变量：对 
        
            σ 
           
            ∈ 
           
            Ω 
           
           \sigma \in \Omega 
          
       σ∈Ω， 
        
            C 
           
            ( 
           
            σ 
           
            ) 
           
           C(\sigma) 
          
       C(σ)为不同的项的比较次数
引理，快排运行时间受制于比较次数
证明目标， 
        
            E 
           
            [ 
           
            C 
           
            ] 
           
            = 
           
            O 
           
            ( 
           
            n 
           
            log 
           
            ⁡ 
           
            n 
           
            ) 
           
           E[C] = O(n \log n) 
          
       E[C]=O(nlogn)
 
由于快排的随机性和不平衡子问题，无法使用Master Method进行数学定式分析
构造块： 
   
             z 
            
             i 
            
           z_i 
          
       zi​，第 
        
            i 
           
           i 
          
       i个 
        
            A 
           
           A 
          
       A中最小的元素
对 
        
            σ 
           
            ∈ 
           
            Ω 
           
           \sigma \in \Omega 
          
       σ∈Ω，以及索引 
        
            i 
           
            < 
           
            j 
           
           i < j 
          
       i<j，记 
        
             x 
            
              i 
             
              j 
             
            ( 
           
            σ 
           
            ) 
           
           x_{ij}(\sigma) 
          
       xij​(σ)为以 
        
            σ 
           
           \sigma 
          
       σ为枢轴时， 
        
             z 
            
             i 
            
           z_i 
          
       zi​和 
        
             z 
            
             j 
            
           z_j 
          
       zj​的比较次数（0或者1）
 
分解方法 
   
            ∀ 
           
            σ 
           
            , 
           
            C 
           
            ( 
           
            σ 
           
            ) 
           
            = 
           
             ∑ 
            
              i 
             
              = 
             
              1 
             
              n 
             
              − 
             
              1 
             
             ∑ 
            
              j 
             
              = 
             
              i 
             
              + 
             
              1 
             
             n 
            
             x 
            
              i 
             
              j 
             
            ( 
           
            σ 
           
            ) 
           
           \forall \sigma, C(\sigma) = \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^n x_{ij}(\sigma) 
          
       ∀σ,C(σ)=∑i=1n−1​∑j=i+1n​xij​(σ)
 
            E 
           
            [ 
           
            C 
           
            ] 
           
            = 
           
             ∑ 
            
              i 
             
              = 
             
              1 
             
              n 
             
              − 
             
              1 
             
             ∑ 
            
              j 
             
              = 
             
              i 
             
              + 
             
              1 
             
             n 
            
            E 
           
            [ 
           
             x 
            
              i 
             
              j 
             
            ] 
           
           E[C] = \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^n E[x_{ij}] 
          
       E[C]=∑i=1n−1​∑j=i+1n​E[xij​]
 
            E 
           
            [ 
           
             x 
            
              i 
             
              j 
             
            ] 
           
            = 
           
            P 
           
            r 
           
            [ 
           
             x 
            
              i 
             
              j 
             
            = 
           
            1 
           
            ] 
           
           E[x_{ij}] = Pr[x_{ij} = 1] 
          
       E[xij​]=Pr[xij​=1]
 
            E 
           
            [ 
           
            C 
           
            ] 
           
            = 
           
             ∑ 
            
              i 
             
              = 
             
              1 
             
              n 
             
              − 
             
              1 
             
             ∑ 
            
              j 
             
              = 
             
              i 
             
              + 
             
              1 
             
             n 
            
            P 
           
            r 
           
            [ 
           
             x 
            
              i 
             
              j 
             
            = 
           
            1 
           
            ] 
           
           E[C] = \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^nPr[x_{ij} = 1] 
          
       E[C]=∑i=1n−1​∑j=i+1n​Pr[xij​=1]
 
通用分解方法原则 
  明确需要关注的随机变量 
        
            Y 
           
           Y 
          
       Y
将这个随机变量表达成一些指示性（简单的）随机变量 
        
            Y 
           
            = 
           
             ∑ 
            
             l 
            
             M 
            
             x 
            
             l 
            
           Y = \sum_l^M x_l 
          
       Y=∑lM​xl​
应用期望的线性性质 
        
            E 
           
            [ 
           
            Y 
           
            ] 
           
            = 
           
             ∑ 
            
             l 
            
             M 
            
            P 
           
            r 
           
            [ 
           
             x 
            
             l 
            
            = 
           
            1 
           
            ] 
           
           E[Y] = \sum_l^M Pr[x_l = 1] 
          
       E[Y]=∑lM​Pr[xl​=1]
 
关键定理： 
      
          ∀ 
         
          i 
         
          < 
         
          j 
         
          , 
         
          P 
         
          r 
         
          [ 
         
           z 
          
           i 
          
          , 
         
           z 
          
           j 
          
           get compared 
         
          ] 
         
          = 
         
           2 
          
            j 
           
            − 
           
            i 
           
            + 
           
            1 
           
         \forall i < j, Pr[z_i,z_j \ \text{get compared}] = \frac 2 {j - i + 1} 
        
     ∀i<j,Pr[zi​,zj​ get compared]=j−i+12​
考虑集合： 
      
           z 
          
           i 
          
          , 
         
           z 
          
            i 
           
            + 
           
            1 
           
          , 
         
          … 
         
          , 
         
           z 
          
            j 
           
            − 
           
            1 
           
          , 
         
           z 
          
           j 
          
         z_i, z_{i + 1}, \ldots, z_{j - 1}, z_j 
        
     zi​,zi+1​,…,zj−1​,zj​ 
  如果 
        
             z 
            
             i 
            
           z_i 
          
       zi​和 
        
             z 
            
             j 
            
           z_j 
          
       zj​被最先选为枢轴，那么二者将会比较一次
否则，二者永远都不会比较，二者被分到两个不同的递归调用中
 
因此： 
      
          E 
         
          [ 
         
          C 
         
          ] 
         
          = 
         
           ∑ 
          
            i 
           
            = 
           
            1 
           
            n 
           
            − 
           
            1 
           
           ∑ 
          
            j 
           
            = 
           
            i 
           
            + 
           
            1 
           
           n 
          
           2 
          
            j 
           
            − 
           
            i 
           
            + 
           
            1 
           
          = 
         
          2 
         
           ∑ 
          
            i 
           
            = 
           
            1 
           
            n 
           
            − 
           
            1 
           
           ∑ 
          
            j 
           
            = 
           
            i 
           
            + 
           
            1 
           
           n 
          
           1 
          
            j 
           
            − 
           
            i 
           
            + 
           
            1 
           
         E[C] = \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^n \frac 2 {j - i + 1} = 2 \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^n \frac 1 {j - i + 1} 
        
     E[C]=∑i=1n−1​∑j=i+1n​j−i+12​=2∑i=1n−1​∑j=i+1n​j−i+11​
对于每一个固定的 
      
          i 
         
         i 
        
     i，其对应的内部项的和为 
      
           ∑ 
          
            j 
           
            = 
           
            i 
           
            + 
           
            1 
           
           n 
          
           1 
          
            j 
           
            − 
           
            i 
           
            + 
           
            1 
           
          = 
         
           1 
          
           2 
          
          + 
         
           1 
          
           3 
          
          + 
         
           1 
          
           4 
          
          + 
         
          … 
         
         \sum_{j = i + 1}^n \frac 1 {j - i + 1} = \frac 12 + \frac 13 + \frac 14 + \ldots 
        
     ∑j=i+1n​j−i+11​=21​+31​+41​+…
因此： 
      
          E 
         
          [ 
         
          C 
         
          ] 
         
          ≤ 
         
          2 
         
          n 
         
          ⋅ 
         
           ∑ 
          
            k 
           
            = 
           
            2 
           
           n 
          
           1 
          
           k 
          
         E[C] \le 2 n \cdot \sum_{k=2}^n \frac1k 
        
     E[C]≤2n⋅∑k=2n​k1​，其中加和项的时间复杂度为对数级
由此可以得出，比较次数的期望为 
      
          O 
         
          ( 
         
          n 
         
          log 
         
          ⁡ 
         
          n 
         
          ) 
         
         O(n \log n) 
        
     O(nlogn)
支锦铭
关注
0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Coursera - Algorithm (Stanford) - 课程笔记 - Week 3

Quicksort - Algorithm关键思想：在枢轴两侧划分数组（左小右大），因此需要重点考虑枢轴的选择两个关于划分的有趣事实线性时间完成操作（O(n)O(n)O(n)），且不需要额外内存减小了问题的尺寸（应用分治法的关键）基本算法过程如果当前子问题处理的长度为1，返回否则令p为当前子问题的序列的枢轴将当前问题的序列划分到枢轴的两侧对枢轴的两侧分别进行递归...
复制链接

扫一扫
专栏目录