文件系统中有四种索引方式，分别是目录索引、文件内容索引、文件逻辑结构中的索引文件和文件物理结构中的索引分配

最新推荐文章于 2024-08-15 19:52:45 发布

Bol5261

最新推荐文章于 2024-08-15 19:52:45 发布

阅读量1.8k

点赞数 14

本文链接：https://blog.csdn.net/blog_programb/article/details/139195407

版权

Sql(SQL Server Database) 同时被 3 个专栏收录

506 篇文章

订阅专栏

Hashtable(a specific key Map)

121 篇文章

订阅专栏

Index(A new Index code rule)

107 篇文章

订阅专栏

文件系统中有四种索引方式，分别是目录索引、文件内容索引、文件逻辑结构中的索引文件和文件物理结构中的索引分配。

目录索引：通过目录来查找文件，目录中保存着文件的相关信息，如文件名、文件大小、创建时间、修改时间等，可以通过目录索引来找到文件的物理地址。
文件内容索引：每个文件在存储时，都被划分为若干个大小相等的块，文件内容索引通过记录每个块所在的物理地址来定位文件的数据块。
文件逻辑结构中的索引文件：为了提高变长记录文件的检索效率，可以将变长记录文件的主文件和一个按关键字排序的定长记录索引文件相对应，主文件和索引文件通过逻辑关键字相对应，提高文件检索速度。
文件物理结构中的索引分配：将文件的所有盘块号都构成一个索引块(表)，每个文件都有一个索引块，索引分配的优点是支持直接访问，且没有外部碎片问题。缺点是由于索引块的分配，增加了系统存储空间的开销。

目录索引是一种文件系统中的索引方法，它将文件的相关信息存储在一个称为目录的结构中。通过目录索引，操作系统可以在文件系统中快速地查找文件的物理地址。在目录索引中，每个文件都有一个对应的目录条目，该条目包含文件的名称、存储位置、创建日期等信息。当用户请求文件时，系统会首先查找目录索引，然后使用文件的物理地址读取文件内容。
非聚集索引是一种数据结构，用于在数据库表中提高查询效率。与聚集索引不同的是，非聚集索引不会改变表的物理顺序，而是将索引存储在一个独立的数据结构中。这使得非聚集索引比聚集索引更适合于那些经常需要进行查询、排序和分组的情况。同时，一个表可以有多个非聚集索引，但只能有一个聚集索引。

聚集索引是指按照一个或多个列的值对表中的行进行排序的索引，这些列通常是主键列。聚集索引决定了表中数据在磁盘上的物理存储顺序，因此一个表只能有一个聚集索引。

区别：

聚集索引决定了数据在磁盘上的物理存储顺序，非聚集索引则不会改变表的物理结构。
一个表只能有一个聚集索引，但可以有多个非聚集索引。
聚集索引通常是主键列，非聚集索引则可以是任何列。
索引是一种用于提高查询速度的数据结构，在数据库中起到类似书籍目录的作用。它可以帮助我们快速地找到需要的数据，而不必扫描整个数据库。索引可以被看作是一个表中一个或多个列的快速查找路径，它们可以大大加快查询的速度。在创建索引时，需要在查询效率和存储空间之间做出平衡。同时，应该尽量避免创建不必要的索引，只在必要的情况下创建索引。

下面给出一个示例，演示如何在MySQL中创建索引：

CREATE INDEX index_name ON table_name (column_name);

其中，index_name 是要创建的索引的名称，table_name 是要进行索引操作的表名，column_name 是要创建索引的列名。
在确定需要在哪些列上创建索引时，需要考虑以下几个方面：

频繁用于检索或排序的列应该创建索引。
作为主键的列自动创建索引。
频繁用于连接的列（例如外键）应该创建索引。
查询中经常使用WHERE子句的列应该创建索引。
数据列只包含彼此各不相同的值时，应该创建唯一索引。

另外，为表中的每个列都创建索引并不总是最佳方案，因为索引会增加查询的成本，并且在更新数据时会降低性能。因此，需要仔细评估表的访问模式和大小，以确定需要为哪些列创建索引。
我们可以使用MySQL中的show indexes语句来查看表的索引情况。例如，如果我们要查看名为table_name的表的索引情况，可以使用以下命令：

SHOW INDEXES FROM table_name;

这个命令将展示表中所有索引的名称、是否为唯一索引、列名、排序方式等信息。此外，我们还可以使用DESCRIBE语句来查看表的详细信息，包括索引信息。例如：

DESCRIBE table_name;

这个命令将展示表中所有列的详细信息，包括索引、数据类型、长度、默认值等信息。
索引对于查询性能的影响是非常显著的。通过使用索引进行查询，可以大大减少数据库系统需要扫描的数据量，从而提高查询速度。此外，通过加速排序等操作，还可以进一步提高查询性能。但是，对于一些情况，建立索引并不是一种明智的选择。例如，在表的记录较少时，使用索引操作可能比直接扫描数据更慢，因为索引本身也需要进行一些操作，导致额外的开销。此外，对于经常进行增删改操作的表，过多的索引也可能导致性能下降。因此，在这些情况下，应该谨慎考虑是否建立索引。需要注意的是，哪些情况适合建索引，哪些情况不适合建索引，需要根据具体的业务场景和数据特点来进行评估和分析。
索引是数据库中非常重要的性能优化方式，可以加速数据的查询速度。常见的索引类型包括：
1.主键索引：在表中创建主键时自动创建，用于确保表中每一行的唯一性，一个表只能建立一个主键索引。
2.唯一索引：用于确保表中某一列的唯一性，可以建立多个唯一索引。
3.普通索引：最基本的索引类型，没有任何约束，可以建立多个普通索引。

此外，还有一些特殊的索引类型：
4.全文索引：用于高效地完成文本的搜索功能。
5.空间索引：用于存储空间数据，支持范围查询和最近邻查询等功能。
6.聚簇索引：将表数据物理上按照索引顺序进行排序，因此每个表只能有一个聚簇索引。

聚簇索引的优点在于：

由于聚簇索引中的数据物理上相邻，因此聚簇索引查询的效率比较高，特别是对于范围查询。
聚簇索引对于主键查询的效率非常高，因为主键通常是聚簇索引。

但是聚簇索引也存在缺点：

当表中的数据经常被修改时，聚簇索引需要频繁地进行重组，会降低写入性能。
聚簇索引占用的空间比较大，因为聚簇索引需要对表中的所有数据进行排序。
在关系数据库中，索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构。索引可以提高数据库表的查询速度，并且可以通过创建唯一索引来保证数据库表中的数据唯一性。索引的作用在于通过索引列快速查找数据库表中的特定数据，从而提高查询速度。同时，索引还可以用于加速表连接操作和排序等操作。

索引的类型可以分为以下几种：

B树索引：B树是一种平衡的、多路搜索树，它的每个节点最多包含k棵子树，k被称为B树的阶。B树索引适合于范围查询，包括等值查询。
B+树索引：B+树是B树的变种，它的非叶子节点不保存数据，只保存关键字和指向子节点的指针。B+树索引适合于范围查询和排序。
哈希索引：哈希索引以哈希表的形式存储，哈希索引适合于等值查询和IN查询。
全文索引：全文索引适用于文本信息的查询，例如博客、新闻等。

创建索引的方法一般有两种：在表创建时创建索引，或者在表创建后使用CREATE INDEX语句创建索引。
索引是一种特殊的数据结构，可以帮助数据库系统高效地查找和访问表中的数据。它通过建立一些数据结构，例如B树或哈希表，为数据库表中的列或字段创建一个快速访问路径。因此，当你使用索引作为查询条件时，数据库系统可以直接使用索引结构来查找匹配的记录，从而极大地提高了查询效率。

具体来说，索引通常可以将查询时间从O(n)降到O(logn)，这意味着随着数据量的增加，查询时间的增长速度将会变得更加缓慢，而不是线性增长。但是，需要注意的是，虽然索引对于查询效率的提升很大，但它也会带来一些额外的开销，如索引维护和存储开销，因此需要权衡索引的创建和使用。

总之，在某些情况下，索引可以显著提高数据库查询的性能，但在其他情况下，它可能并不会提高性能，甚至可能会使性能变得更糟。因此，在建立和使用索引时，应该遵循一些最佳实践，以确保其最大化效益。

<<引用:索引到底能提升多少查询效率？何时该使用索引？一文快速搞懂数据库索引及合理使用它。而加上索引的最大作用就是加快查询速度，它能从根本上减少需要扫表的记录/行的数量。四、Mysql中的索引。引用:索引到底能提升多少查询效率？何时该使用索引？一文快速搞懂数据库索引及合理使用它。而且建立的索引并不是越多越好，因为索引虽然能够提高查询效率，但是会大大得影响插入、删除和修改的效率，因为每一次数据的更新都会牵涉到对索引的修改。 >>
索引会影响数据库的插入、删除、修改和查询的效率。虽然索引能够提高查询效率，但是会大大得影响插入、删除和修改的效率，因为每一次数据的更新都会牵涉到对索引的修改。因此，需要权衡是否需要在某些字段上建立索引。如果表的数据量非常少，不建议建立索引，因为建立索引本身也有一定的开销。

下面是一个例子，展示了索引的影响。假设有一个名为products的表，其中有10万条记录，该表的结构如下所示：

CREATE TABLE products (
  id INT(11) NOT NULL AUTO_INCREMENT,
  name VARCHAR(100) NOT NULL,
  category VARCHAR(100) NOT NULL,
  price DECIMAL(10, 2) NOT NULL,
  PRIMARY KEY (id)
);

我们可以在name和category这两个字段上添加索引：

ALTER TABLE products ADD INDEX name_index (name);
ALTER TABLE products ADD INDEX category_index (category);

现在，我们在products表中插入10万条记录：

import random
import string
import time
import pymysql

conn = pymysql.connect(host='localhost', user='root', password='password', db='test', charset='utf8mb4')
cur = conn.cursor()

start_time = time.time()

for i in range(100000):
    rand_str = ''.join(random.sample(string.ascii_letters + string.digits, 8))
    sql = f"INSERT INTO products (name, category, price) VALUES ('{rand_str}', 'test', {i})"
    cur.execute(sql)

end_time = time.time()
print(f"插入10万条记录共花费{end_time - start_time:.2f}s")

conn.commit()
cur.close()
conn.close()

执行上述Python脚本，所需时间约为16秒钟。接下来，我们在products表中查询价格在5000到6000之间的记录：

SELECT * FROM products WHERE price BETWEEN 5000 AND 6000;

这个查询大约需要0.01秒钟的时间。现在，我们再次插入10万条记录：

start_time = time.time()

for i in range(100000, 200000):
    rand_str = ''.join(random.sample(string.ascii_letters + string.digits, 8))
    sql = f"INSERT INTO products (name, category, price) VALUES ('{rand_str}', 'test', {i})"
    cur.execute(sql)

end_time = time.time()
print(f"插入10万条记录共花费{end_time - start_time:.2f}s")

执行上述Python脚本，所需时间约为16秒钟。此时，我们再次查询价格在5000到6000之间的记录：

SELECT * FROM products WHERE price BETWEEN 5000 AND 6000;

这个查询大约需要0.10秒钟的时间，比之前慢了10倍。

在这里插入图片描述