原理
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到全部待排序的数据元素排完。
python实现
def selection_sort(arr):
for i in range(len(arr)-1):
min_index = i
for j in range(i+1, len(arr)):
if arr[j] < arr[min_index]:
min_index = j
if i != min_index:
arr[min_index], arr[i] = arr[i], arr[min_index]
return arr
arr = [2,3,6,1,0,5,8]
selection_sort(arr)
排序结果如下:
[0, 1, 2, 3, 5, 6, 8]
以上代码的实现步骤是这样的:
- 第一层循环用来决定第一个元素的位置;
min_index
用来记录最小值的下标;- 第二层循环用来找到和第一个元素相比,最小的那个元素,然后将
min_index
的下标替换成此元素的下标; - 交换位置,将最小值不断的迭代到最前面;
算法性能
时间复杂度
选择排序的交换操作介于 0 和 (n - 1) 次之间。选择排序的比较操作为 n (n - 1) / 2 次之间。选择排序的赋值操作介于 0 和 3 (n - 1) 次之间。比较次数O(n^2),比较次数与关键字的初始状态无关,总的比较次数N=(n-1)+(n-2)+…+1=n*(n-1)/2。交换次数O(n),最好情况是,已经有序,交换0次;最坏情况交换n-1次,逆序交换n/2次。交换次数比冒泡排序少多了,由于交换所需CPU时间比比较所需的CPU时间多,n值较小时,选择排序比冒泡排序快。
稳定性
选择排序是给每个位置选择当前元素最小的,比如给第一个位置选择最小的,在剩余元素里面给第二个元素选择第二小的,依次类推,直到第n-1个元素,第n个元素不用选择了,因为只剩下它一个最大的元素了。那么,在一趟选择,如果一个元素比当前元素小,而该小的元素又出现在一个和当前元素相等的元素后面,那么交换后稳定性就被破坏了。比较拗口,举个例子,序列5 8 5 2 9,我们知道第一遍选择第1个元素5会和2交换,那么原序列中两个5的相对前后顺序就被破坏了,所以选择排序是一个不稳定的排序算法。
最后,分享另一段代码:
def sort(arr):
for i in range(len(arr)-1):
for j in range(i+1, len(arr)):
if arr[i] > arr[j]:
arr[i], arr[j] = arr[j], arr[i]
return arr
从选择排序的原理看,这种写法并不算是真正的选择排序了,虽然也能实现最后的排序功能,也是很多人会写的一种(不推荐),和上面的代码非常像,但是区别在于:
没有指定最小值的
index
,直接进行比较,所以在比较的过程中,只要出现比基准值小的值,就立即发生交换,此时基准值也会发生变化,而标准的选择排序算法中,基准值是会初始化为arr[i]
的,而且是要找到最小值后,才发生交换动作。
这是有细微区别的,大家可以用一个简单的数组做测试,在纸上把步骤都演算出来,看看它们的区别。
经过测试,发现这种写法和上面的写法相比,他们的比较次数都是相同的;但是发生交换的次数,这种写法要多很多,而交换动作是比较浪费资源的。所以,这种写法并不推荐。