查找

线性表查找

顺序查找

示例1:在成绩中查询分数是100的第一个分数
示例2:在学生中查询分数是100的第一个学生

存储结构可以是顺序表,也可以是链表

  • 逐个比较查询,如果找到,返回数据或者索引,如果到最后也没有找到,返回null
  • 可以是在顺序表中,也可以是在链表中
  • 在各个节点查找概率相同情况下,默认查询长度为一半长度,所以时间复杂度是T(n) = O(n)
/**
*功能:在分数中查询指定分数的索引
**/
public class TesetSearch1{
    public static void main(String[] args){
        //给定分数数组
        int[] scoreArr = {89,45,78,45,100,98,86,100,65};
               
        //给定要查找的分数
        int score =65;
        
        //完成查找
       int index = search(scoreArr,score);
        //输出结果
        if(index==-1){
            System.out.println("该分数不存在");
        }else{
            System.out.println(score+"的索引是"+index);
        }
 
    }
    //顺序查找,T(n) = O(n),S(n) = O(1)
    public static int search(int[] arr, int key){
        int index = -1;
        for(int i=0;i<arr.length;i++){
            if(arr[i] == key){
                index = i;
                break;
            }
        }
        
        return index;
 
    }

}

折半查找

  • 折半查找又称为二分查找,这种查找方法需要待查的查找表满足两个条件
    (1)查找表必须使用顺序结构存储
    (2)查找表必须按关键字大小有序排列

使用非递归实现折半查找
T(n) = O( l o g 2 n log_2n log2n)
key = 21的查找过程
在这里插入图片描述
key = 85的查找过程
在这里插入图片描述

/**
*前提:顺序结构,按照关键字有序
**/
public class TestSearch2{
    public static void main(String[] args){
        //给定数组
        int[] array = {1,2,3,4,5,6,7,8,9,10};
        //给定要查找的值
        int key = 2;
        //进行折半二分查找
        int index = binarySearch(array,key);
        //输出结果
        if(index==-1){
            System.out.println("不存在");
        }else{
            System.out.println(key+"的索引是"+index);
        }
    }
    
    //不使用递归 T(n)=O($log_2n$) S(n)=O(1)
    public static int binarySearch(int[] array,int key){
        //指定low和high
        int low = 0;
        int high = array.length-1;
        
        
        //折半查找
        while(low<=high){
            //求得mid
            int mid = (high+low)/2;
            //判断是否等于
            if(key == array[mid]){
                return mid;
             }else if(key<array[mid]){
                 high = mid-1;
             }else{//key>array[mid]
                 low = mid+1;
             }
        }       
        return -1;
    }
    
    //使用递归  T(n)=O($log_2n$) S(n)=O($log_2n$)
    public static int binarySearch2(int[] array,int key){
         //指定low和high
          int low = 0;
          int high = array.length-1;
          return binarySearch2(array,key,low,high);
          
    }
    
    public static int binarySearch2(int[] array,int key,int low, int high){
         //递归的结束条件
         if(low>high){
             return -1;
         }
         int mid = (low+high)/2;
         if(key == array[mid]){
             return mid;
         }else if(key<array[mid]){
             return binarySearch2(array,key,low,mid-1);
         }else{//key>array[mid]
             return binarySearch2(array,key,mid+1,high);
         }     
    }
}

查找树

二叉查找/搜索/排序树 BST (binary search/sort tree)
或者是一棵空树;
或者是具有下列性质的二叉树:
(1)若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值
(2)若它的右子树上所有结点的均值大于它的根结点的值
(3)它的左、右子树也分别为二叉排序树
在这里插入图片描述
在这里插入图片描述
注:对二叉查找树进行中序遍历,得到有序集合

平衡二叉树(Self-balancing binary search tree)

  • 自平衡二叉查找树,又被称为AVL树(有别于AVL算法)
  • 它是一棵空树
  • 或它的左右两个子树的高度差(平衡因子)的绝对值不超过1
  • 并且左右两个子树都是一棵平衡二叉树
  • 同时,平衡二叉树必定是二叉搜索树,反之则不一定

平衡因子(平衡度):结点的平衡因子是结点的左子树的高度减去右子树的高度(或反之定义)
平衡二叉树:每个结点的平衡因子都为1、-1、0的二叉排序树。或者说每个结点的左右子树的高度最多差1的二叉排序树

平衡二叉树的目的是为了减少二叉查找树层次,提高查找速度

平衡二叉树的常用实现方法有AVL、红黑树、替罪羊树、Treap、伸展树等
在这里插入图片描述
红黑树
R-B Tree,全称是Red-Black Tree,又称为“红黑树”,它是一种平衡二叉树。红黑树的每个结点上都有存储位表示结点的颜色,可以是红(Red)或黑(Black)

红黑树的特性:
(1)每个结点或者是黑色,或者是红色
(2)根结点是黑色
(3)每个叶子结点(NIL)是黑色。
(4)如果一个结点是红色的,则它的子结点必须是黑色的
(5)从一个结点到该结点的子孙结点的所有路径上包含相同数目的黑结点

注意:
(1)特性(3)中的叶子结点是指为空(NIL或NULL)的结点
(2)特性(5),确保没有一条路径会比其他路径长出两倍。因而,红黑树是相对接近平衡的二叉树
在这里插入图片描述
红黑树的应用比较广泛,主要是用它来存储有序的数据,它的时间复杂度是O(logN),效率非常之高
它虽然是复杂的,但它的最坏情况运行时间也是非常良好的,并且在实践中是高效的:它可以在O(logN)时间内做查找,插入和删除,这里的N是树中元素的数目
例如,Java集合中的TreeSet和TreeMap,C++ STL中的set、map,以及Linux虚拟内存的管理,都是通过红黑树取实现的

B树(balanced tree)
与二叉平衡树相比,是多叉的
可以降低树的深度,提高查找效率

B树应文件系统的要求而发展起来的,大量数据存储在外存中,通常存放在硬盘中
由于是海量数据,不可能一次调入内存。因此,要多次访问外存。但硬盘的驱动受机械运动的制约,速度慢
在这里插入图片描述
B+树
在B树的基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现,非叶子结点作为叶子结点的索引;B+树总是到叶子结点才命中

数据库的索引的默认数据结构就是采用B+树

在这里插入图片描述
B*树
是B+树的变体,在B+树的非根和非叶子结点再增加指向兄弟的指针
在这里插入图片描述

哈希表查找

前面查找方法共同特点:通过将关键字值与给定值比较,来确定位置。效率取决比较次数
理想的方法是:不需要比较,根据给定值能直接定位记录的存储位置
这样,需要在记录的存储位置与该记录的关键字之间建立一种确定的对应关系,使每个记录的关键字与一个存储位置相对应

哈希表的结构和特点
hashtable 也叫散列表

  • 特点:快、很快、神奇的快
  • 结构:结构有多种
  • 最流行、最容易理解:顺序表+链表
  • 主结构:顺序表
  • 每个顺序表的结点再单独引出一个链表
    在这里插入图片描述
    在这里插入图片描述
    哈希表是如何添加数据的
  1. 计算哈希码(调用hashCode(),结果是一个int值,整数的哈希码取自身即可)
  2. 计算在哈希表中的存储位置y=k(x)=x%11 x是哈希码,k(x)是函数,y是在哈希表中的存储位置
  3. 存入哈希表
    情况1:一次添加成功
    情况2:多次添加成功(出现了冲突,调用equals()和对应链表的元素进行比较,比较到最后,结果都是false,创建新结点,存储数据,并加入链表末尾)
    情况3:不添加(出现了冲突,调用equals()和对应链表的元素进行比较,经过一次或多次比较后,结果是true,表明重复,不添加)

结论1:哈希表添加数据快(3步即可,不考虑冲突)
结论2:唯一
结论3:无序
在这里插入图片描述
哈希表是如何查询数据的
和添加数据的过程是相同的
情况1:一次找到 23 86 76
情况2:多次找到 67 56 78
情况3:找不到 100 200

结论1:哈希表查询数据快
结论2:哈希表删除数据快
结论3:哈希表更新数据快(如果更新后影响到哈希码值,就比较繁琐了,比如要删除再添加)

hashCode和equals到底有什么神奇的作用
hashCode():计算哈希码,是一个整数,根据哈希码可以计算出数据在哈希表中的存储位置
equals():添加时出现了冲突,需要通过equals进行比较,判断是否相同;查询时也需要使用equals进行比较,判断是否相同

各种类型数据的哈希码应该如何获取

  1. int 取自身,看Integer的源码
  2. double 3.14 3.15 3.145 6.567 9.87 不可以取整,看Double的源码
  3. String java oracle j+a+v+a 不可以将各个字符的编码值相加
    abc cba bac a:97 b:98 c:99
    abc 197+298+399
    cba 1
    99+298+397
  4. Student 先看各个属性的哈希码,进行某些相加相乘的运算
    int id
    String name
    int age
    double score

如何减少冲突

  1. 哈希表的长度和表中的记录树的比例–装填因子
    如果哈希表的空间远远大于最后实际存储的记录个数,则造成了很大的空间浪费;如果选取小了的话,则容易造成冲突。在实际情况中,一般需要根据最终记录存储个数和关键字的分布特点来确定哈希表的大小。还有一种情况是可能事先不知道最终需要存储的记录个数,则需要动态维护哈希表的容量,此时可能需要重新计算哈希地址
    装填因子=表中的记录数/哈希表的长度
    如果装填因子越小,表明表中还有很多的空单元,则添加发生冲突的可能性越小;而装填因子越大,则发生冲突的可能性就越大,在查找时所耗费的时间就越多。有相关文献证明当装填因子在0.5左右的时候,Hash的性能能够达到最优。因此,一般情况下,装填因子取经验值0.5
  2. 哈希函数的选择
    直接定址法 平方取中法 折叠法 除留取余法(y=x%11)
  3. 处理冲突的方法
    链地址法 开放地址法 再散列法 建立一个公共溢出区

Java中的查找树和哈希表

  • Java中TreeSet和TreeMap底层就使用了红黑树
    添加结点过程中会通过旋转等方法,保证每次添加前后都是平衡树
    TreeSet的底层结构是TreeMap,都使用了红黑树在这里插入图片描述
    在这里插入图片描述
    在JDK1.8中有了一些变化,当链表的存储的数据个数大于等于8时,不再采用链表存储,而采用了红黑树存储结构
    在这里插入图片描述
    这么做主要是查询的时候复杂度上,链表为O(n),而红黑树一直是O(logn)。如果冲突多,并且超过8,采用红黑树来提高效率

  • Java中HashSet和HashMap底层就使用了哈希表HashTable
    (1)HashMap底层结构:JDK1.7及其之前,HashMap就是一个table数组+链表实现的存储结构
    (2)HashSet底层采用HashMap,HashSet的元素做HashMap的key,统一使用Object对象作为value

private static final Object PRESENT = new Object();
public boolean add(E e){
    return map.put(e,PRESENT) == null;
}

(3)HashMap源码分析(JDK1.7),重点:

  • 属性
  • 构造方法
  • put()
  • get()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值