Elasticsearch之中文分词器

转载 2018年04月17日 20:12:00

前提

什么是倒排索引?

Elasticsearch之分词器的作用

Elasticsearch之分词器的工作流程

Elasticsearch之停用

 

 

Elasticsearch的中文分词器

  1、单字分词

    如:“我们是中国人”
    效果:“我”“们”“是”“中”“国”“人”

  2、二分法分词:按两个字进行切分。

    如:“我们是中国人”,效果:“我们”、“们是”、“是中”、“中国”、“国人”。

  3、词库分词:按某种算法构造词,然后去匹配已建好的词库集合,如果匹配到就切分出来成为词语。通常词库分词被认为是最理想的中文分词算法。

 

  后续博客

Elasticsearch之几个重要的分词器

ElasticSearch 系列(3) 安装中文分词器

ElasticSearch需要有中文分词器, 1、安装 smartcn 分词器(官方提供) 在elasticsearch安装目录下(/usr/share/elasticsearch)执...
  • janbox
  • janbox
  • 2017-02-17 11:03:11
  • 693

解决elasticsearch安装中文分词器

开始安装。 1、下载 下载地址为: https://github.com/medcl/elasticsearch-analysis-ik 或者从官网地址搜索:https://www.elasti...
  • cow5287687
  • cow5287687
  • 2017-12-19 12:28:25
  • 137

二、Elastic5.5.2安装中文分词器教程及简单测试

一、下载分词器安装包首先进入各版本下载页面,选择相应的版本进行下载(和自己安装的ElasticSearch版本保持一致)。我这里安装的是5.5.2的ElasticSearch,所以选择对应的5.5.2...
  • KingBoyWorld
  • KingBoyWorld
  • 2017-09-03 18:00:44
  • 1184

安装elasticsearch及中文分词器、客户端连接示例

本文记录了linux下如何安装elasticsearch及分词器,以及如何通过『spring-data-elasticsearch』连接服务器,并进行索引、搜索。 1、下载elasticse...
  • xxgwo
  • xxgwo
  • 2016-04-24 19:18:05
  • 935

Elasticsearch中文分词器安装

Elasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器)、english (英文分词)和chinese (中文分词)。分词的操作也称为“分析(anal...
  • qbian
  • qbian
  • 2018-02-23 14:50:53
  • 101

elasticsearch 安装ik中文分词

全文搜索对于中文分词很重要,所以需要ik插件分词支持中文分词 英文使用空格很容易分词,中文需要根据词意进行分词,需要【字典】支持 插件项目:https://github.com/medcl/ela...
  • c5113620
  • c5113620
  • 2018-02-20 13:04:57
  • 267

elasticsearch 中文分词器ik

  • 2016年09月13日 14:11
  • 3.14MB
  • 下载

elasticsearch-analysis-ik-5.6.0

  • 2017年10月27日 15:56
  • 4.29MB
  • 下载

maven 构建好的 IK 分词器,可直接使用

  • 2016年10月31日 14:10
  • 3.97MB
  • 下载

elasticsearch-analysis-ik

  • 2018年04月02日 13:11
  • 3.14MB
  • 下载
收藏助手
不良信息举报
您举报文章:Elasticsearch之中文分词器
举报原因:
原因补充:

(最多只允许输入30个字)