本文IT技术学习网将给大家讲述什么是mysql全文索引中的停止词(stopword也有的翻译做停止字)。
stopword
在全文索引中,如果一个词被认为是太普通或者太没价值,那么它将会被搜索索引和搜索查询忽略。innodb和myisam分别有两组不同的设置,控制着对应的stopword。
全文检索时,停止词列表将会被读取和检索,在不同的字符集和排序方式下(character_set_server and collation_server 系统变量),可能会导致在搜索时的停止词的不匹配。
停止词是否大小写敏感,取决于不同的排序方式,比如:latin1_swedish_ci下停止词是大小写敏感的,latin1_general_cs 或 latin1_bin下停止词是大小写不敏感的。
innodb的索引停止词
innodb的默认停止词列表很短。查询INFORMATION_SCHEMA.INNODB_FT_DEFAULT_STOPWORD表来查看默认的innodb停止词表。
-
- mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_FT_DEFAULT_STOPWORD;
-
- +-------+
-
- | value |
-
- +-------+
-
- | a |
-
- | about |
-
- | an |
-
- | are |
-
- | as |
-
- | at |
-
- | be |
-
- | by |
-
- | com |
-
- | de |
-
- | en |
-
- | for |
-
- | from |
-
- | how |
-
- | i |
-
- | in |
-
- | is |
-
- | it |
-
- | la |
-
- | of |
-
- | on |
-
- | or |
-
- | that |
-
- | the |
-
- | this |