算法笔记0305

1、梳排序、希尔排序、Timsort

        梳排序(Comb sort)是一种不稳定排序算法,改良自冒泡排序,其要旨在于消除乌龟,亦即在阵列尾部的小数值,这些数值是造成冒泡排序缓慢的主因。相对地,兔子,亦即在阵列前端的大数值,不影响冒泡排序的效能。

       在冒泡排序中,只比较阵列中相邻的二项,即比较的二项的间距(Gap)是1,梳排序提出此间距其实可大于1,改自插入排序的希尔排序同样提出相同观点。梳排序中,开始时的间距设定为阵列长度,并在循环中以固定比率递减,通常递减率设定为1.3。在一次循环中,梳排序如同冒泡排序一样把阵列从首到尾扫描一次,比较及交换两项,不同的是两项的间距不固定于1。如果间距递减至1,梳排序假定输入阵列大致排序好,并以冒泡排序作最后检查及修正。

        递减率的设定影响着梳排序的效率,原作者以随机数作实验,得到最有效递减率为1.3的。如果此比率太小,则导致一循环中有过多的比较,如果比率太大,则未能有效消除阵列中的乌龟。亦有人提议用


        希尔排序是把记录按下标的一定增量分组,增量的个数即为组数,对每组使用直接 插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。
        首先选择增量gap=length/2,缩小增量继续以gap = gap/2的方式,这种增量选择可以用一个序列来表示,{n/2,(n/2)/2...1},称为增量序列。希尔排序的增量序列的选择与证明是个数学难题,这个增量序列是比较常用的,也是希尔建议的增量,称为希尔增量,但其实这个增量序列不是最优的。

        Timsort是结合了归并排序和插入排序的混合排序算法,虽然插入排序的时间复杂度要高于归并排序,但当待排序列非常短时,比较时间复杂度意义不大。Timsort 的大致思想是先采用插入排序将非常短的小段扩充为较长的小段,再采用归并排序来合并多个较长的小段,具体来说,我们需要定义一个参数minrun,当小段长度小于minrun时,我们认为它是非常小的小段,否则认为它是较长的小段。

2、一致性哈希解决负载均衡问题

        使用多台服务器处理请求时,一个基本问题是如何分配请求,可以将服务器编号,然后计算请求的哈希值,对服务器数量N取模,均匀地将任务分配到各台服务器上。

        当服务器数量出现变化时,如果很多请求都更换服务器,会造成大量的数据迁移,给后端数据库和硬盘带来压力。理想情况是,将服务器数量从N变为N-1时,只会导致1/(N-1)的请求更换服务器,将服务器数量从N变为N+1时,只会导致1/(N+1)的请求更换服务器。

        一致性哈希可以解决这个问题:选择两个合适的哈希函数,将请求和服务器都分别映射到一个区间上的整数,然后把请求和服务器都标记在一个环上。每个请求都由其顺时针方向上的第1个服务器来处理。


        如果改动(增加或减少)一台服务器,只需要将一小部分请求改动给别的服务器处理


        弊端:

        服务器数量较少时,分布不均,会使一些服务器承担过重;

        增加一台服务器时,只能减轻一台服务器的请求量,其他服务器不会改善;

        减少一台服务器时,会有一台服务器承受两倍重量。

        解决办法:

        可以将服务器定义为多个哈希函数,并将它们全部标记在环上。这样服务器数量少时也会分布比较均匀,增加一台服务器时,新服务器会出现在环上多个位置,减少一台服务器时,请求量也会比较均匀地分担给多台服务器。


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值