数据结构与算法基础课------1.认识复杂度

        作为一个21世纪的开发工作者,对算法和数据结构的学习现在已经越来越重要了,所以我想将自己对算法和数据结构的一些理解和认识总结出来,让各位读者进行指正。

        这个总结我准备分为三部分:基础课、进阶课和练习课。从简单到困难将自己关于这方面的知识展现出来。

一.认识复杂度

        我们学习算法就是为了提升代码的执行效率,但是实现同一功能的算法有那么多,如何区分区分各种算法的优劣呢?主要指标有:

   1.时间复杂度(流程决定)

        既然我们知道时间复杂度是评判算法优劣的一个标准,那么我们现在需要知道时间复杂度的评估方式,时间复杂度分析的基本策略是:从内向外分析,从最深层开始分析。如果遇到函数调用,要深入函数进行分析。主要步骤拆分为:

        1).常数时间的操作

         什么是常数时间的操作呢?如果一个操作的执行时间不以具体样本量为转移,每次执行时间都是固定时间。称这样的操作为常数时间的操作。通俗的将,执行时间固定的操作都是常数时间的操作。反之,执行时间不固定操作,都不是常数时间的操作。

        常见的常数时间操作包括:

常见的算术运算(+-、*、/% 等)

常见的位运算(>>>>><<|&^等)

赋值、比较、自增、自减操作等

数组寻址操作

        2).确定算法流程的总操作数量与样本数量之间的表达式关系 

        如何确定算法流程的总操作数量与样本数量之间的表达式关系呢?

1,想象该算法流程所处理的数据状况,要按照最差情况来。

2,把整个流程彻底拆分为一个个基本动作,保证每个动作都是常数时间的操作。

3,如果数据量为N,看看基本动作的数量和N是什么关系。

        此时基本的时间复杂度的表达式已经出来了,下边就是去除影响比较小的参数,

        3).只看表达式最高阶项的部分

        当完成了表达式的建立,只要把最高阶项留下即可。低阶项都去掉,高阶项的系数也去掉。记为:O(忽略掉系数的高阶项)。可能有人会想抹掉了好多东西,只剩下了一个最高阶项,还有意思吗?非常有意义:当我们要处理的样本量很大很大时,我们会发现低阶项是什么不是最重要的;每一项的系数是什么,不是最重要的。真正重要的就是最高阶项是什么。这就是时间复杂度的意义,它是衡量算法流程的复杂程度的一种指标,该指标只与数据量有关,与过程之外的优化无关。

        4).实例加深印象

        下面通过三个例子,来实践对时间复杂度的估算(因为代码比较简单,所以只提供思路了,以后都会写代码):

1.选择排序

    过程分析:

arr[0N-1]范围上,找到最小值所在的位置,然后把最小值交换到0位置。

arr[1N-1]范围上,找到最小值所在的位置,然后把最小值交换1位置。

arr[2N-1]范围上,找到最小值所在的位置,然后把最小值交换2位置。

arr[N-1N-1]范围上,找到最小值位置,然后把最小值交换N-1位置

估算时间复杂度:

很明显,如果arr长度为N,每一步常数操作的数量,如等差数列一般

所以,总的常数操作数量 = a*(N^2) + b*N + c (abc都是常数)

所以选择排序的时间复杂度为O(N^2)

 2.冒泡排序

     过程分析:

arr[0N-1]范围上:

arr[0]arr[1],谁大谁来到1位置;arr[1]arr[2],谁大谁来到2位置arr[N-2]arr[N-1],谁大谁来到N-1位置

在arr[0N-2]范围上,重复上面的过程,但最后一步是arr[N-3]arr[N-2],谁大谁来到N-2位置

在arr[0N-3]范围上,重复上面的过程,但最后一步是arr[N-4]arr[N-3],谁大谁来到N-3位置

最后在arr[01]范围上,重复上面的过程,但最后一步是arr[0]arr[1]谁大谁来到1位置

估算复杂度:

很明显,如果arr长度为N,每一步常数操作的数量,依然如等差数列一般

所以,总的常数操作数量 = a*(N^2) + b*N + c (abc都是常数)

所以冒泡排序的时间复杂度为O(N^2)

3. 插入排序

    过程分析:

想让arr[0~0]上有序,这个范围只有一个数,当然是有序的。

想让arr[0~1]上有序,所以从arr[1]开始往前看,如果arr[1]<arr[0],就交换。否则什么也不做。

arr[0~i]上有序,所以从arr[i]开始往前看arr[i]这个数不停向左移动,一直移动到左边的数字不再比自己大,停止移动。

最后一步,想让arr[0~N-1]有序, arr[N-1]这个数不停向左移动,一直移动到左边的数字不再比自己大,停止移动。

估算时发现这个算法流程的复杂程度,会因为数据状况的不同而不同

        如果某个算法流程的复杂程度会根据数据状况的不同而不同,那么你必须要按照最差情况来估计。很明显,在最差情况下,如果arr长度为N,插入排序的每一步常数操作的数量,还是如等差数列一般。所以,总的常数操作数量 = a*(N^2) + b*N + c (a、b、c都是常数)。所以插入排序排序的时间复杂度为O(N^2)。

         5).注意事项

1,算法的过程,和具体的语言是无关的。

2,想分析一个算法流程的时间复杂度的前提,是对该流程非常熟悉

3,一定要确保在拆分算法流程时,拆分出来的所有行为都是常数时间的操作。这意味着你写算法时,对自己的用过的每一个系统api,都非常的熟悉。否则会影响你对时间复杂度的估算。

   2.额外空间复杂度(流程决定)

        你要实现一个算法流程,在实现算法流程的过程中,你需要开辟一些空间来支持你的算法流程。哪些才算额外空间复杂度呢?

        作为输入参数的空间,不算额外空间。

        作为输出结果的空间,也不算额外空间

        因为这些都是必要的、和现实目标有关的。所以都不算。但除此之外,你的流程如果还需要开辟空间才能让你的流程继续下去。这部分空间就是额外空间。

        如果你的流程只需要开辟有限几个变量,额外空间复杂度就是O(1)。

   3.常数项时间(实现细节决定)

        既然计算复杂度的时候会忽略低阶项和所有常数系数,那么难道同样时间复杂度的流程,在实际运行时候就一样的好吗?当然不是,时间复杂度只是一个很重要的指标而已。如果两个时间复杂度一样的算法,你还要去在时间上拼优劣,就进入到拼常数时间的阶段,简称拼常数项。

        如何比拼常数项时间呢?此时建议放弃理论知识,直接生成随机数据进行测试,不继续理论分析是因为常数时间的分析非常麻烦,都已经到了具体细节的程度,莫不如交给实验数据好了。比如:都是固定时间,还是有快慢之分的,就像位运算的常数时间远小于算术运算的常数时间,这两个运算的常数时间又远小于数组寻址的时间。

 二.  交流和代码

        如果想进行交流,可以关注我的微信公众号:小春说java。同时可以领取代码。

    

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

!春明!

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值