GBase 8c 词典-停用词

大壮十二

于 2022-02-15 14:10:05 发布

阅读量152

点赞数

分类专栏： SQL

本文链接：https://blog.csdn.net/qq_41614765/article/details/122943435

版权

html p2p sql

SQL 专栏收录该内容

25 篇文章 0 订阅

订阅专栏

停用词是很常见的词，几乎出现在每一个文档中，并且没有区分值。因此，在全文搜索的语境下可忽视它们。例如，每一段英文文本都包含a和the，因此将其存储在索引中是没有用的。然而，停用词影响tsvector中的位置，同时位置也会影响相关度：

gbase=# SELECT to_tsvector('english','in the list of stop words');

        to_tsvector

----------------------------

 'list':3 'stop':5 'word':6

(1 row)

位置1、2、4是停用词，所以不显示。

大壮十二

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
GBase 8c 词典-停用词

停用词是很常见的词，几乎出现在每一个文档中，并且没有区分值。因此，在全文搜索的语境下可忽视它们。例如，每一段英文文本都包含a和the，因此将其存储在索引中是没有用的。然而，停用词影响tsvector中的位置，同时位置也会影响相关度：gbase=# SELECT to_tsvector('english','in the list of stop words');to_tsvector----------------------------'list':3 ...
复制链接

扫一扫

专栏目录