学了这么久的数据分析,没有去看看数据结构与算法,现在要补一下。
比如经典的冒泡排序法 。
基本思想:
将待排序的元素看做是竖着排列的“气泡” , 较小的元素比较松, 从而要上浮。
● 比较相邻的元素。如果第一个比第二个大,就交换他们两个。
● 对每一个相邻元素做同样的工作,从开始的第一对到结尾的最后一对。最后的元素应该是会是最大的数。
● 针对所有的元素重复以上的步骤,除了最后一个。
● 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较
算法分析
时间复杂度
若文件的初始状态是正序的,一趟扫描即可完成排序。所需的关键字比较次数 C ,和记录移动次数 M均达到最小值:
,
。
所以,冒泡排序最好的时间复杂度为 O(n)
若初始文件是反序的,需要进行 n - 1 趟排序。每趟排序要进行 n - i 次关键字的比较(1≤i≤n-1),且每次比较都必须移动记录三次来达到交换记录位置。在这种情况下,比较和移动次数均达到最大值:
,
冒泡排序的最坏时间复杂度为 O(n^2) 。
综上,因此冒泡排序总的平均时间复杂度为 O(n^2) 。
代码实现:
def bubble(bubbleList):
listLength = len(bubbleList)
while listLength > 0:
for i in range(listLength - 1):
if bubbleList[i] > bubbleList[i+1]:
tmp=bubbleList[i]
bubbleList[i]=bubbleList[i+1]
bubbleList[i+1]=tmp
listLength -= 1
print(bubbleList)
if __name__ == '__main__':
bubbleList = [3, 4, 1, 2, 5, 8, 0]
bubble(bubbleList)