中文分词介绍
众所周知,英语是基于单词的,单词和单词之间用空格隔开,而中文是基于单词的。句子中的所有单词都可以连接起来以描述含义。例如,英文句子“我是学生”将用中文表示“我是学生”。计算机可以很容易地通过空间知道学生是一个单词,但是不能轻易地理解“学习”和“生”这两个单词共同代表一个单词。将汉字序列划分为有意义的单词就是中文分词,有些人也将其称为切词。我是一名学生,并且分词的结果是:我是一名学生。
应用场景
例如,我们要在内容字段中搜索具有“中文分词搜索功能”的文章。如果使用“喜欢”查询,则可以匹配以下内容:
喜欢“中文分%”
喜欢’%中文分词搜索功能%’
如“分词搜索功能%”
如果输入“中文搜索功能”,则无法匹配相应的文章。此时,您必须使用中文分词搜索功能。分词搜索的原理是按关键字分割内容。上段可以分为“中文”,“分词”,“搜索”,“功能”,然后将这些关键字和内容与索引和查询结果相关联。
扩展安装
pdo_sqlite
sqlite3
mbstring
LaravelScoutTNTSearch驱动程序,用于提取中文分词
作曲家需要vanry/laravel-scout-tntsearch
发布侦查配置文件,如果安装了侦查,则可以省略。
phpartisanvendor:publish–provider=“Laravel\Scout\ScoutServiceProvider”
发布tntsearch配置文件。
phpartisanvendo
PHP 实现中文分词搜索功能
最新推荐文章于 2024-05-14 09:43:40 发布
![](https://img-home.csdnimg.cn/images/20240611030827.png)