数据结构与算法分析概括

参考博文:https://blog.csdn.net/u012152619/article/details/42059675

1、时间复杂度之间的关系:O(1)<O(logn)<O(n)<O(nlog n)<O(n2)<O(2n)<O(n!)<O(nn)

2、常用算法设计思想

枚举法

贪心法

分治法

回溯法

动态规划法

分支限界法

3、python在表达链表、二叉树等结构上的不便,这种算法问题还是用C/C++或Java更好。

4、散列

散列函数:无论你给它什么数据,它都还你一个数字。

散列函数的设计有两方面追求:把较长的关键码映射到较小的区间,尽可能消除关键码与映射值之间明显的规律。散列函数的映射关系越乱越好,越不清晰越好。

散列函数:数字分析、折叠法、中平方法、除余法、基数转换法

冲突是必然出现的事件。

散列表:也被称为散列映射、映射、字典和关联数组。

简单查找的时间为O(n),二分查找的时间为O(logn),散列查找的时间为O(1)。最坏情况下散列为O(n)。

装填因子 = 散列表包含的元素数/位置总数     

避免冲突需要有:较低的装填因子、良好的散列函数

经验:装填因子超过0.7,就调整散列表长度。

5、无序数组  优点:插入快,如果知道下标,可以很快存取。             缺点:查找慢、删除慢,大小固定。

有序数组:查找快(二分查找),插入和删除慢。

二分查找的运算时间为对数时间,40亿的量也只需要查找32次。

6、基于比较的排序最优解为O(nlogn)。排序算法的稳定性:能够维持序列中所有排序码相同的记录的相对位置不变。

7、给一组数据,如果要手动排序,一般选择快排或者归并(复杂度小),容易实现;

一般每一种编程语言都会自带基本的库,如C,Python的,都自带有排序函数,直接调用系统库函数即可。

8、排序的目的是为了查找。查找分以下几类:

https://www.cnblogs.com/leezx/p/5719012.html

8.1 顺序查找

说明:顺序查找适合于存储结构为顺序存储或链接存储的线性表。

基本思想:顺序查找也称为线形查找,属于无序查找算法。从数据结构线形表的一端开始,顺序扫描,依次将扫描到的结点关键字与给定值k相比较,若相等则表示查找成功;若扫描结束仍没有找到关键字等于k的结点,表示查找失败。

复杂度分析:

查找成功时的平均查找长度为:(假设每个数据元素的概率相等) ASL = 1/n(1+2+3+…+n) = (n+1)/2 ;

当查找不成功时,需要n+1次比较,时间复杂度为O(n);

所以,顺序查找的时间复杂度为O(n)

8.2 二分查找

说明:元素必须是有序的,如果是无序的则要先进行排序操作。

基本思想:也称为是折半查找,属于有序查找算法。用给定值k先与中间结点的关键字比较,中间结点把线形表分成两个子表,若相等则查找成功;若不相等,再根据k与该中间结点关键字的比较结果确定下一步查找哪个子表,这样递归进行,直到查找到或查找结束发现表中没有这样的结点。

复杂度分析:最坏情况下,关键词比较次数为log2(n+1),且期望时间复杂度为O(log2n)

注:折半查找的前提条件是需要有序表顺序存储,对于静态查找表,一次排序后不再变化,折半查找能得到不错的效率。但对于需要频繁执行插入或删除操作的数据集来说,维护有序的排序会带来不小的工作量,那就不建议使用

8.3 插值查找

对二分的优化。

经过以上分析,折半查找这种查找方式,不是自适应的(也就是说是傻瓜式的)。二分查找中查找点计算如下:

mid=(low+high)/2, 即mid=low+1/2*(high-low);

通过类比,我们可以将查找的点改进为如下:

mid=low+(key-a[low])/(a[high]-a[low])*(high-low),

也就是将上述的比例参数1/2改进为自适应的,根据关键字在整个有序表中所处的位置,让mid值的变化更靠近关键字key,这样也就间接地减少了比较次数。

8.4 斐波那契查找

也是对二分的优化。

8.5 数表查找

二叉查找树平均查找性能不错,为O(logn),但是最坏情况会退化为O(n)。在二叉查找树的基础上进行优化,我们可以使用平衡查找树。平衡查找树中的2-3查找树,这种数据结构在插入之后能够进行自平衡操作,从而保证了树的高度在一定的范围内进而能够保证最坏情况下的时间复杂度。但是2-3查找树实现起来比较困难,红黑树是2-3树的一种简单高效的实现,他巧妙地使用颜色标记来替代2-3树中比较难处理的3-node节点问题。红黑树是一种比较高效的平衡查找树,应用非常广泛,很多编程语言的内部实现都或多或少的采用了红黑树。

除此之外,2-3查找树的另一个扩展——B/B+平衡树,在文件系统和数据库系统中有着广泛的应用。

8.6 分块查找

8.7 哈希查找

Hash是一种典型以空间换时间的算法,比如原来一个长度为100的数组,对其查找,只需要遍历且匹配相应记录即可,从空间复杂度上来看,假如数组存储的是byte类型数据,那么该数组占用100byte空间。现在我们采用Hash算法,我们前面说的Hash必须有一个规则,约束键与存储位置的关系,那么就需要一个固定长度的hash表,此时,仍然是100byte的数组,假设我们需要的100byte用来记录键与位置的关系,那么总的空间为200byte,而且用于记录规则的表大小会根据规则,大小可能是不定的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值