Elasticsearch——04全文搜索服务器_ES集成ik分词器&类型文档映射

最新推荐文章于 2021-07-17 20:29:33 发布

rui9527

最新推荐文章于 2021-07-17 20:29:33 发布

阅读量185

点赞数

分类专栏： JavaWeb 文章标签： Elasticsearch

本文链接：https://blog.csdn.net/qq_37999340/article/details/86748487

版权

JavaWeb 专栏收录该内容

21 篇文章 1 订阅

订阅专栏

1.ES集成ik分词器

lucene由于是jar工具包,如果要在使用lucene的环境下使用ik分词器,只需导入对应jar,做一些配置就行.
以插件的方式集成ES服务器,客户端只需告诉我们某个字段要用这个分词器就行了。

步骤:

①服务端安装ik插件
②客户端端指定字段用插件

安装：

1)下载源码:https://github.com/medcl/elasticsearch-analysis-ik
2)maven打包：mvn package
3)安装到es服务器
解压到es/plugins
4)配置
5)重启

测试：

#测试ik分词器
POST _analyze
{
  "analyzer":"ik_smart",
  "text":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"
}

2.类型文档映射

ES的文档映射(mapping)机制用于进行字段类型或分词器确认，将每个字段匹配为一种确定的数据类型。-就相当于在设计表的时候为字段指定类型.

ES支持的数据类型：

① 基本字段类型
字符串：text(分词),keyword(不分词) StringField(不分词文本),TextFiled(要分词文本)
text默认为全文文本，keyword默认为非全文文本
数字：long,integer,short,double,float
日期：date
逻辑：boolean
② 复杂数据类型
对象类型：object
数组类型：array
地理位置：geo_point,geo_shape

①默认映射
ES在没有配置Mapping的情况下新增文档，ES会尝试对字段类型进行猜测，并动态生成字段和类型的映射关系。