一、归并排序说明
归并排序是建立在归并操作上的一种有效的排序算法,该算法采用经典的分治策略(分治法将问题分(分解)成一些小的问题然后递归求解,而治(合并)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之),将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序,若将两个有序表合并成一个有序表,称为二路归并。
二、归并排序的基本思想
将待排序序列sequence[0…n-1]看成是n个长度为1的有序序列,将相邻的有序表成对归并,得到n/2个长度为2的有序表;将这些有序序列再次归并,得到n/4个长度为4的有序序列;如此反复进行下去,最后得到一个长度为n的有序序列。
三、归并排序的算法描述
第一步:申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列。
第二步:设定两个指针,最初位置分别为两个已经排序序列的起始位置。
第三步:比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置
重复步骤3直到某一指针超出序列尾,将另一序列剩下的所有元素直接复制到合并序列尾。
归并排序要做两件事:
(1)“分解”——将序列每次折半拆分(递归实现)。
(2)“合并”——将划分后的序列段两两合并后排序。
如何拆分?
如何合并?
在每次合并过程中,都是对两个有序的序列段进行合并,然后排序。
这两个有序序列段分别为 sequence[front_pointer, mid] 和 sequence[mid+1, after_pointer]。
先将他们合并到一个局部的暂存数组tmp中,带合并完成后再将tmp复制回sequence中。
我们称 sequence[front_pointer, mid] 第一段,sequence[mid+1, after_pointer] 为第二段。
每次从两个段中取出一个记录进行关键字的比较,将较小者放入tmp中,最后将各段中余下的部分直接复制到tmp中。
经过这样的过程,tmp已经是一个有序的序列,再将其复制回sequence中,一次合并排序就完成了。
四、归并排序动图演示
五、详细代码实现-python
'''
归并排序
sequence待排序列
'''
def merge_sort(sequence):
# 获取待排序列的长度
length = len(sequence)
# 递归终止退出条件
if length <= 1:
return sequence
'''
分解问题:
由于每一次递归,middle的值都在变小,因此达到将大问题化为小问题的目的。
'''
# 获取中间下标
middle = length // 2
# 从头到中间的部分赋值给前序列
front_sequence = merge_sort(sequence[:middle]) # 对前侧的列表进行排序
# 从中间到结尾的部分复制给后序列
after_sequence = merge_sort(sequence[middle:]) # 对后侧的列表进行排序
'''
merge 合并操作
将问题的解进行合并
'''
# 初始化两个指针front_pointer, after_pointer 初始位置为起始位置,初始化一个临时数组tmp
front_pointer = 0
after_pointer = 0
# 初始化tmp中转数组
tmp = list()
# 计算当前被合并的列表的长度
front_len = len(front_sequence)
after_len = len(after_sequence)
# 前侧的长度大于前侧指针 并且 后侧长度大于后侧指针
while front_len > front_pointer and after_len > after_pointer:
# 如果当前的前侧数据小于等于当前的后侧数据则将小的值(前侧数组中的数据)赋值到临时数组tmp中
if front_sequence[front_pointer] <= after_sequence[after_pointer]:
# 左侧序列中,当前指针正在指向的元素为前后序列中较小值且添加到中转数组中
tmp.append(front_sequence[front_pointer])
# 前侧序列指针向后移动一次
front_pointer += 1
else: # 否则,后序列中的指针指向的当前值比前序列中的值要小
# 将后序列中的当前指针指向的值添加到中转数组中
tmp.append(after_sequence[after_pointer])
# 后序列中的指针向后移动一次
after_pointer += 1
'''
归并结束后:
会出现前序列或后序列中还有一部分元素没有被比较到,但是由于这部分未
比较的序列本身就已有序,因此可以使用列表的+法运算直接拼接在当前列表的后面。
'''
# 如果front和after的长度不相等,把长的部分直接追加到列表中
tmp += front_sequence[front_pointer:]
tmp += after_sequence[after_pointer:]
return tmp
if __name__ == '__main__':
sequence = [44, 23, 11, 231, 2356, 121, 1, 14, 6, 9, 4, 5, 33]
new_list = merge_sort(sequence)
print(new_list)