第二章 创建高性能索引


索引:索引是存储引擎用于快速查找出一条数据的一种数据结构。

一、.索引的类型:B-Tree 索引、哈希索引
    
    1.B-Tree 索引:最常用的索引,B-Tree索引能够加快访问数据的速度,因为存储引擎不再需要进行全表扫描来获取需要的数据,取而代之的是从索引的根节点开始进行搜索,根节点的槽中放有指向子节点的指针,存储引擎根据这些指针向下层查找。
        通过比较节点页的值和要查找的值可以找到合适的指针进入下层子节点,这些指针实际上定义了子节点页中值的上限和下限 。最终存储引擎要么找到对应的值,要么值不存在。
    
    可使用B-Tree索引的查询类型: 假设一个user表,索引为姓、名、生日(lastName,firstName,birthday),此索引对如下查询有效
        全值匹配 :既查询条件为索引的三列
        匹配最左前缀 :可以查找所有姓‘Allen’的人,即只使用第一列。
        匹配列前缀 :可以用索引查询以‘J’开头的姓的人
        匹配范围值 :例如索引可以查找姓在‘Allen’和‘Barry’之间的人。此例也只使用了索引第一列。
        精确匹配某一列并范围匹配另一列 :索引可以查找姓‘Allen’和名‘J’开头的人,既第一列全匹配,第二列范围匹配
        只访问索引的查询 :
    
    B-tree树索引的限制:
        1.如果不是按照索引最左列开始查找,则无法使用索引,比如无法使用例子中索引查找名为‘Green’的人。
        2.不能跳过索引的列,索引无法用于查找姓‘Allen’和生日为‘1982-09-15’的人,这是MYSQL只能使用索引的第一列
        3.如果查询的某列是范围查询,则其右边所有列无法使用索引优化查找,既索引无法用于where lastName = 'Allen' and firstName like 'J' and birthday = '1980-09-15',这时使用的是精确匹配某一列并范围匹配另一列查找
    总结:索引列的顺序对查询很重要,在优化性能时,可能需要使用相同的列但顺序不同的索引来满足不同类型的查询需求。 
    
    2.哈希索引 hash index :基于哈希表实现,只有精确匹配所有的列才有效,对于每一行数据,存储引擎都会根据索引列生成每条数据的hash code,哈希索引存储每条数据的hash code,同时保存指向每条数据的指针。

    哈希索引的限制:
        1.哈希索引只包含hash code和指针,而不存储字段值,所有不能使用索引中的值来避免读取行。
        2.哈希索引数据不是按照索引值顺序存储的,所有也无法用于排序。
        3.哈希索引不支持部分列匹配查找,需要全部匹配。
        4.哈希索引只支持等值比较查询,包括= 、in()、<=>
        5.访问哈希索引的数据非常快,除非有hash冲突(不同的索引值却有相同的hash code)。
        6.如何哈希索引冲突很多的话,一些索引维护操作代价会很高。例如在某个选择性很低的列建立哈希索引
    
    总结:因为这些限制,哈希索引只适用某些特定场合,而一旦适合哈希索引,则它带来的性能提升非常显著。例如,在数据仓库中有种经典的“星型”schema,需要关联很多查找表,哈希索引就非常适合。除了Memory外,NDB集群引擎也支持唯一哈希索引。


    3.空间数据索引 R-Tree : MyISAM表支持索引,可以用作地理数据存储。

    4.全文索引:是一种特殊的索引,它查找的是文本中的关键词,而不是直接比较索引中的值,全文索引类似搜索引擎做的事情,而不是简单的where条件匹配

二、索引的优点

    1.索引大大减少了服务器需要扫描的数据量
    2.索引可以帮助服务器避免排序和临时表
    3.索引可以将随机I/O变为顺序I/O

    评价一个索引是否适合某个查询的‘三星系统’:索引将相关的记录放在一起则获得一星;如果索引中列顺序和查询中where顺序一致则获得二星;如果索引的列包含了查询中需要的全部列则获得三星。
    索引适合中大型表,数据量很小的表全表扫描效率更高,而特大型表,则需要考虑分区技术。

三、高性能索引策略

    1.独立的列:是指索引列不能是表达式的一部分,也不能是函数的参数。(始终将索引列单独放在等式一侧)
    
    2.前缀索引和索引选择性:如果需要索引一个很长的字符列(text,或者很长的varchar),会让索引变的大且慢,可以考虑创建前缀索引。mysql前缀索引不支持做order by 和group by,也无法使用前缀索引做覆盖扫描。
        前缀索引多少字符,需要考虑选择性是否够高,同时又不能太长(节约空间),决定前缀的合适长度,select count(distinct left(列名,num))/count(*) from table_name;数值越高num越短越好。
        创建前缀索引语法:ALTER TABLE table_name ADD key(列名(num)) 

    3.多列索引:很多人对索引理解不够,常见的错误是为每个列建索引 和 错误的顺序创建索引。

    4.选择合适的列顺序:创建一个合适列顺序的索引经验法则是:将选择性最高的列放在索引最前列(不考虑排序和分组时)。在一个多列的B-Tree索引中,索引列的顺序意味着索引首先按照最左列进行排序,其次是是第二列。
        索引,索引可以按照升序或者降序进行扫描,以满足符合顺序的查询需求。
    
    5.聚簇索引:是一种数据存储方式,具体细节依赖其实现方式,但InnoDB的聚簇索引实际上是在同一结构中保存了B-Tree索引和数据行。mySql的主键是聚簇索引。

    6.覆盖索引:索引包含了所需要查询的字段的值,我们称为‘覆盖索引’,mysql可以使用索引直接获取列的值,而不需要再读取数据行。

    7.冗余和重复的索引:重复索引是指在相同的列上按照相同的顺序创建的相同类型的索引,这会使数据库单独维护重复的索引,影响性能。
        冗余索引和重复索引有所不同,比如你建立了索引(A,B),再创建索引(A)就冗余了。(如果创建索引(B,A)或者(B)则不是冗余)
    
    8.未使用的索引:除了冗余和重复索引,还有一些服务器永远用不到的索引,这些索引完全是累赘,需要删除。需要工具来查找未使用的索引。

    9.索引和锁:索引可以让查询锁定更少的行,如果你的查询从不访问这些不需要的行,将会锁定的更少。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像中的目标属于哪个类别。 定位问题:确定目标在图像中的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像中的目标属于哪个类别。 定位问题:确定目标在图像中的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
健身国际俱乐部系统是一种专为健身俱乐部设计的管理软件,它通过集成多种功能来提高俱乐部的运营效率和服务质量。这类系统通常包含以下几个核心模块: 1. **会员管理**:系统能够记录会员的基本信息、会籍状态、健身历史和偏好,以及会员卡的使用情况。通过会员管理,俱乐部可以更好地了解会员需求,提供个性化服务,并提高会员满意度和忠诚度。 2. **课程预约**:会员可以通过系统预约健身课程,系统会提供课程时间、教练、地点等详细信息,并允许会员根据个人时间表进行预约。这有助于俱乐部合理安排课程,避免资源浪费。 3. **教练管理**:系统可以管理教练的个人信息、课程安排、会员反馈等,帮助俱乐部评估教练表现,优化教练团队。 4. **财务管理**:包括会员卡销售、课程费用、私教费用等财务活动的记录和管理,确保俱乐部的财务透明度和准确性。 5. **库存管理**:对于俱乐部内的商品销售,如健身装备、营养补充品等,系统能够进行库存管理,包括进货、销售、库存盘点等。 6. **数据分析**:系统能够收集和分析会员活动数据,为俱乐部提供业务洞察,帮助俱乐部制定更有效的营销策略和业务决策。 7. **在线互动**:一些系统还提供在线平台,让会员可以查看课程、预约私教、参与社区讨论等,增强会员之间的互动和俱乐部的社区感。 8. **移动应用**:随着移动设备的普及,一些健身俱乐部系统还提供移动应用,方便会员随时随地管理自己的健身计划。 9. **安全性**:系统会确保所有会员信息的安全,采取适当的数据加密和安全措施,保护会员隐私。 10. **可扩展性**:随着俱乐部业务的扩展,系统应该能够轻松添加新的功能和服务,以适应不断变化的市场需求。 健身国际俱乐部系统的选择和实施,需要考虑俱乐部的具体需求、预算和技术能力,以确保系统能够有效地支持俱乐部的运营和发展。通过这些系统的实施,健身俱乐部能够提供更加专业和高效的服务,吸引和保留更多的会员,从而在竞争激烈的
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像中的目标属于哪个类别。 定位问题:确定目标在图像中的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像中的目标属于哪个类别。 定位问题:确定目标在图像中的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值