映射
安装了 IK 分词器, 如何在索引和搜索的时候使用 IK 分词器呢 ?
如何指定其他类型的 field , 比如日期类型, 数值类型等 ?
创建映射
post: http://localhost:9200/video/doc/_mapping
{
"properties": {
"name": {
"type": "text"
},
"description": {
"type": "text"
},
"studymodel": {
"type": "keyword"
}
}
}
更新映射
映射创建成功可以添加新字段, 已有字段不允许更新.
删除映射
通过删除索引来删除映射
查询映射
查询所有的索引 :
get: http://localhost:9200/_mapping
常用映射类型
text 文本字段
字符串包括 text 和 keyword 两种类型 :
text:
"name":
{
#name字段的类型为text
"type": "text",
#使用IK分词器是 ik_max_word 分词模式
"analyzer":"ik_max_word",
#搜索时使用ik_smart提高搜索精确性
"search_analyzer":"ik_smart",
#指定属性是否索引 默认为 true, 只有索引才可以从索引库中搜索到
#但是有一些属性比如图片的地址不需要索引
"index":true,
#是否在 source 之外存储, 每个文档索引后会在 ES 中保存一份原始文件, 存放在 "_source" 中,
#一般情况下不需要设置 store 为 true, 因为在 "_source" 中已经有一份原始文档了
"store":true
}
例如:
{
"properties": {
"name": {
"type": "text",
"analyzer":"ik_max_word",
"search_analyzer":"ik_smart"
},
"description": {
"type": "text",
"analyzer":"ik_max_word",
"search_analyzer":"ik_smart"
},
"pic":{
"type":"text",
"index":false
},
"studymodel":{
"type":"text"
}
}
}
keyword:
上面介绍的 text 文本字段在映射时需要设置分词器, keyword 作为关键字字段, 通常搜索 keyword 是按照整体搜索, 所以创建 keyword 字段的索引是不进行分词的, 比如 邮政编码, 手机号码, 身份证 等… keyword 通常用于过滤. 排序以及聚合 等 .
例如 :
{
"properties": {
"studymodel":{
"type":"keyword"
},
"name":{
"type":"keyword"
}
}
}
date 日期类型
日期类型不需要设置分词器, 通常日期类型的字段用于排序, 通过 format 设置日期格式 :
例如 : 下面的设置允许 date 字段存储年月日时分秒. 年月日, 毫秒三种格式.
{
"properties": {
"timestamp": {
"type": "date",
"format": "yyyy‐MM‐dd HH:mm:ss||yyyy‐MM‐dd"
}
}
}
数值类型
下面是 ES 支持的数值类型
- 尽量选择范围小的类型, 提高搜索的效率
- 对于浮点数尽量采用比例因子, 比如一个价格字段, 单位为元, 我们把比例因子设置为 100, 这在 ES 中会按分存储, 映射如下
"price": {
"type": "scaled_float",
"scaling_factor": 100
}
由于比例因子为 100, 因此如果我们输入的价格为 23.34 则 ES 中会将 23.34 乘以 100 存储在 ES 中.
使用比例因子的原因是整形比浮点型更容易压缩, 节省磁盘空间.
- 如果比例因子不合适, 则从下标中选择范围小的去存储
{
"name": "spring开发基础",
"description": "spring 在java领域非常流行,java程序员都在用。",
"studymodel": "201001",
"pic":"group1/M00/00/01/wKhlQFqO4MmAOP53AAAcwDwm6SU490.jpg",
"timestamp":"2018‐07‐04 18:28:58",
"price":38.6
}
综合例子
创建如下映射:
POST: http://localhost:9200/xc_course/doc/_mapping
{
"properties": {
"description": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
},
"name": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
},
"pic": {
"type": "text",
"index": false
}
}
}