希尔排序
第一趟,
d
1
d_1
d1 = n/2 = 9//2 = 5 = gap, 每组数据进行插入排序
d
2
d_2
d2 =
d
1
/
2
d_1/2
d1/2 ,以此类推
def insert_sort_gap(li, gap):
for i in range(gap,len(li)): # i 表示取到的数的下标,为无序区的第一个数
j = i - gap # 有序区的最后一个数的下标
tmp = li[i]
# 找插入的位置
while j >= 0 and li[j] > tmp:
li[j+gap] = li[j]
j = j - gap
li[j+gap] = tmp
def shell_sort(li):
d = len(li) // 2
while d >= 1:
insert_sort_gap(li, d)
d // 2
希尔排序的时间复杂度和选取的gap有关
计数排序
对列表进行排序,已知列表中的数的范围都在0到100之间。设计时间复杂度为O(n)的算法。
def count_sort(li, max_count=100):
# 建立一个max_count+1的列表
count = [0 for _ in range(max_count+1)]
# 计数,计算每个数有对少个
for val in li:
count[val] += 1
# 将原列表清空
li.clear()
# 根据计数的列表,将数据填入li中
for ind, val in enumerate(count):
for i in range(val):
li.append(ind)
时间复杂度为O(n),但是有很大的限制,首先要知道列表中数的最大值,且占据很大空间
桶排序
在计数排序当中,如果元素范围比较大,会比较占用空间,如何优化?
桶排序(Bucket Sort):首先将元素分在不同的桶中,再对每个桶中的元素排序。
def bucket_sort(li, n=100, max_num=10000):
# 分到100个桶中,并且最大的值为10000
buckets = [[] for _ in range(n)] # 创建桶,二维列表
for var in li:
# 0-> 0, 86->0
i = min(var // (max_num // n), n-1) # i 表示var放到几号桶里面
buckets[i].append(var) # 把var放入到桶里面
# 保持桶内的顺序
for j in range(len(buckets[i]-1, 0, -1)):
if buckets[i][j] < buckets[i][j-1]:
buckets[i][j], buckets[i][j-1] = buckets[i][j-1], buckets[i][j]
else:
break
#把桶内的数据输出出来
sorted_li = []
for buc in buckets:
sorted_li.extend(buc)
return sorted_li
时间复杂度,桶排序的表现取决于数据的分布,也就是需要对不同数据排序是采取不同的分桶策略。
平均情况时间复杂度:O(n+k)
最坏情况时间复杂度:O(
n
2
k
n^2k
n2k)
空间复杂度:O(nk)
基数排序
- 多关键字排序:假设现在又一个员工表,要求按照薪资排序,并且按照年龄排序
- 先按照年龄排序,再按照薪资进行稳定的排序
对32,13,94,52,17,54,93排序。
先对个位分桶,再挨个出数。
再对十位数分桶,再挨个出数
def radix_sort(li):
max_num = max(li) # 最大值 99 ->2次, 888->3次
it = 0
# 寻找最大数是几位数
while 10 ** it <= max_num:
buckets = [[] for _ in range(10)] # 0~0, 数字的个位十位范围都是0~9
# 对当前位数分桶
for var in li:
# 取当前位数
digit = (var // 10 ** it) % 10
buckets[digit].append(var)
li.clear()
# 把桶内数重新写回li
for buc in buckets:
li.extend(buc)
it += 1 # 位数加一:从个位到百位
时间复杂度:O(kn), k表示最大的位数,最大数为10000的话,k=5, k=log(10, n)
空间复杂度:O(k+n)