数据库：全文索引实现技巧，架构师是这样实现的

知识分享官

于 2024-07-14 14:14:39 发布

阅读量818

点赞数 15

文章标签：数据库 django python

本文链接：https://blog.csdn.net/2301_78976656/article/details/140416363

版权

全文检索并没有你想象中的难，创建全文检索的核心思路是：初始化索引环境，为表字段创建索引，通过分词处理搜索文本，匹配索引中的词汇与记录行，最后根据匹配结果构建并返回相关数据。

初始化全文搜索：首先，如果尚未初始化，需要通过调用FullText.init()方法来初始化全文搜索功能。这会在数据库中创建必要的schema和表。
创建全文索引：使用FT_CREATE_INDEX函数为特定的表和列创建全文索引。这会触发对表中现有数据的索引构建过程。
更新数据触发器：当在索引的表上执行插入、更新或删除操作时，相应的触发器会被激活，以确保全文索引与表数据保持同步。
执行搜索查询：用户执行全文搜索，使用FT_SEARCH函数提交搜索请求。搜索请求包含搜索文本、结果数量限制和偏移量。
处理搜索请求：数据库接收到搜索请求后，会进行以下操作：
- 分词：将搜索文本分解成单个词汇。
- 查找词汇ID：在WORDS表中查找每个词汇对应的ID。
- 收集行ID：使用词汇ID在MAP表中查找所有相关联的行ID。
构建查询结果：根据收集到的行ID，构建查询结果。这可能包括：
- 直接使用行ID在ROWS表中检索主键条件。
- 使用主键条件在原始表中检索具体的数据行。
返回结果集：数据库将构建好的查询结果作为结果集返回给用户。结果集可能包含原始数据或者用于进一步查询的SQL语句。
结果展示：用户根据返回的结果集获取所需的数据，这可能涉及到在应用程序中展示搜索结果或进一步的数据操作。

整理了这份面试笔记包括了：Java面试、Spring、JVM、MyBatis、Redis、MySQL、并发编程、微服务、Linux、Springboot、SpringCloud、MQ、Kafka 面试专题

需要全套面试笔记【点击此处】即可免费获取

sql

代码解读

复制代码

CREATE TABLE FT.INDEXES( ID INT AUTO_INCREMENT PRIMARY KEY, SCHEMA VARCHAR, TABLE VARCHAR, COLUMNS VARCHAR, UNIQUE(SCHEMA, TABLE) );

sql

代码解读

复制代码

CREATE TABLE FT.WORDS( ID INT AUTO_INCREMENT PRIMARY KEY, NAME VARCHAR, UNIQUE(NAME) );

sql

代码解读

复制代码

CREATE TABLE FT.ROWS( ID IDENTITY, HASH INT, INDEXID INT, KEY VARCHAR, UNIQUE(HASH, INDEXID, KEY) );

sql

代码解读

复制代码

CREATE TABLE FT.MAP( ROWID INT, WORDID INT, PRIMARY KEY(WORDID, ROWID) );

sql

代码解读

复制代码

CREATE TABLE FT.IGNORELIST( LIST VARCHAR );

数据存储：当创建全文索引时，数据库会扫描指定的列，将文本分解成词汇，并为每个词汇创建一个条目。然后，它会将这些词汇与包含它们的行的主键条件关联起来。
触发器更新：数据库使用触发器来自动更新全文索引。当对表进行插入、更新或删除操作时，触发器会调用FullText类的fire方法来相应地更新索引数据。
搜索查询：搜索操作通过构建一个查询来实现，该查询使用词汇表和映射表来找到包含搜索词汇的行。然后，可以使用这些行的主键条件来检索原始表中的数据。