1.1算法复杂度分析
概念
1 数据结构 ->数据的存储结构
2算法就是操作数据的方法 解决特定问题的一组指令
3有数据无数据结构是无意义的 反之同理
算法复杂度 嵌套相乘 分开则相加 常对幂指阶
复杂度描述的是算法执行时间或占用内存空间随数据规模的增长关系
public static int sum(int n){ int sum = 0; for (int i = 1; i < n; ++i) { sum =sum+i; } return sum; }
假设每行代码的执行时间为timer 则总代码的执行时间为 (3n+3))timer所以时间复杂度为T(n)
第1行代码:1次 第2行代码:1次 第3行代码:n-1次 第4行代码:n-1次 第5行代码:n-1次 第6行代码:1次 第7行代码:1次
根据每行代码执行次数和假设的每行代码执行时间为timer,我们可以计算出代码的执行时间。
执行时间 = (1次 * timer) + (1次 * timer) + ((n-1)次 * timer) + ((n-1)次 * timer) + ((n-1)次 * timer) + (1次 * timer) + (1次 * timer) = (3n + 3) * timer
public static int sum2(int n){ int sum = 0; for (int i = 1; i < n; ++i) { for (int j = 1; j < n; ++j) { sum = sum + i * j; } }return sum; }
T(n)=O(n^2)
public void test04(int n){ int i=1; while(i<=n){ i = i * 2; } }
O(log n)
public void test05(int n){ int i=0; for(;i<=n;i++){ test04(n); } }
public void test04(int n){ int i=1; while(i<=n){ i = i * 2; } }
O(n * log n)
void print(int n) { int i = 0; int[] a = new int[n]; for (i; i <n; ++i) { a[i] = i * i; } for (i = n-1; i >= 0; --i) { System.out.println(a[i]); } }
传入一个变量n,决定申请多少的int数组空间内存,此段代码的空间复杂度为O(n)
1.2数组
数组是一种用连续的内存空间存储相同数据类型数据的线性数据结构
a[i] = baseAddress + i * dataTypeSize
随机访问 插入O(n) 删除 O(n)
1.3链表
链表是一种物理存储单元上非连续非顺序的存储结构,链表中的每一个元素称为结点
单链表
p.next=q data next
双向链表 双循环链表
为了更快找到结点 prev data next
循环链表
尾结点指向头结点 具有环形结构
1.4栈和队列
栈 先进后出 last In first out
队列 先进先出 first In first out
1.5 散列表
散列查找的基本思想
在记录的存储位置和它的关键码之间建立一个确定的对应关系H,使得每个关键码key和唯一的存储位置H(key)相对应。
散列函数的设计原则
-
计算简单。散列函数不应该有很大的计算量,否则会降低查找效率。
-
函数值(即散列地址)分布均匀,希望散列函数能够把记录以相同的概率“散列”到散列表的所有地址空间中,这样才能保证存储空间的有效利用,并减少冲突
根据键key直接访问内存存储位置值value的数据结构
由数组演化而来的 利用数组支持按照下标进行随机访问数据的特性
y=f(x)
key -> hash(key) ->value
1.5.2散列函数
将键映射为数组下标的函数叫做散列函数 hashValue=hash(key)
1. 直接定址法
直接定址法的散列函数是关键码的线性函数,即: H(key) = a × key + b(a,b为常数)
例如,关键码集合为{10,30,50,70,80,90},选取H(key) = key/10。则散列表如下图所示。 直接定址法的特点是不会产生冲突,但实际应用中能使用这种散列函数的情况很少。它适用于事先知道关键码的分布,关键码集合不是很大且连续性较好的情况。
-
除留余数法 除留余数法的基本思想是:选择某个适当的正整数p,以关键码除以p的余数作为散列地址,即: H(key) = key mod p 可见这个方法的关键在于选取合适的p,否则容易产生同义词。例如,若p含有质因子,例如p = m × n,则所有含有m或n因子的关键码的散列地址均为m或n的倍数,如下图所示
显然,这增加了冲突的机会。一般情况下,若散列表表长为m,通常选p小于或等于表长(最好接近m)的最小素数或不包含小于20质因子的合数
3. 平方取中法
处理冲突的方法
1. 开放定址法
如果由关键码得到的散列地址产生了冲突,根据(H(key) + d)% m 寻找下一个空的散列地址。m取表长
2. 拉链法(链地址法)
1.5.3散列冲突
对于不同的key计算得到的散列值都不同是不可能的 当散列值相同时指向同一个下标索引时就是散列冲突的情况
1.5.4链表法
数组加链表 hashtable
1.6二叉树
红黑树的特质 二叉平衡树的进阶
性质1:节点要么是红色,要么是黑色
性质2:根节点是黑色
性质3:叶子节点都是黑色的空节点
性质4:红黑树中红色节点的子节点都是黑色
性质5:从任一节点到叶子节点的所有路径都包含相同数目的黑色节点
插入进来的结点是红结点 跟节点是黑色节点 叶子节点一定是黑色节点黑红不能重复除开最后一层以外
在这些规则的约束下,红黑树能够保证平衡
红黑树 的复杂度
查找 红黑树也是一棵BST (二叉搜索树) 查找操作的时间复杂度为O(logn)
添加 添加先要从根节点开始找到元素添加的位置 时间为O(logn)
添加完成后涉及到复杂度为O(1)的旋转调整操作 所以时间复杂度为O(logn)