关于Elasticsearch

关于Elasticsearch

Elaticsearch是专门用于解决搜索问题的NoSQL的文档数据库。

无论使用哪种操作系统,只需要下载elasticsearch的压缩包并解压即可使用,需要注意,elasticsearch文件夹的各层级的父级文件夹的名称中不允许包含非ASCII码字符和空格!例如放在D盘根目录下:

执行bin目录下的elasticsearch即可启用Elasticsearch服务:

**注意:**在使用Elasticsearch的过程中,以上窗口不可关闭!

当启动成功后,你可以通过浏览器访问 http://localhost:9200.

elasticsearch提供了一套基于RESTful的访问,你可以使用任何一种可以提交REST请求的工具来访问elasticsearch及其中的数据,例如常见的测试工具PostMan等。

或者,你也可以在IntelliJ IDEA中,使用HTTP Request进行访问:

在HTTP Request文件中编写需要提交的请求,然后,点击左侧的运行图标即可发起请求

使用elasticsearch分词

Elasticsearch之所以能够高效处理搜索,是因为它会将你的数据进行“分词”处理,即将一段文本拆成若干个文本,在执行搜索时,会尝试检查是否匹配“拆”出来的某个文本。

向 http://localhost:9200/_analyze 提交请求即可分词,并且,请求中必须包含请求参数,参数名称固定为text,整个请求的格式大致如下:

 查询Elasticsearch的状态,通常用于检查Elasticearch是否可用
GET http://localhost:9200

提示:在同一个.http文件中,可以编写多个请求,但是,后续的请求的代码必须使用 ### 和前序的请求分开,不能只使用1个 #

你也可以尝试对中文的句子进行分词,会发现,在默认情况下,Elasticsearch只能将中文中的每个字拆出来,并不能正确的处理各个词语!

示例代码:

### 测试分词 -- 中文
GET http://localhost:9200/_analyze
Content-Type: application/json

{
  "text": "很高兴认识你!"
}

可以在Elasticsearch中添加新的分词插件来解决以上问题,经典的中文分词插件就是ik分词器。

所有插件都应该放在Elasticsearch下的plugin文件夹下

你需要将下载得到的ik分词器的压缩包解压出来,将解压得到的文件夹放在plugins文件夹下,而ik分词器的文件夹名称就叫ik即可:

**注意:**完成后,需要重启Elasticsearch(关了再打开)才可以应用新添加的分词器!

接下来,你就可以使用IK分词器对中文的句子进行分词!你需要在请求参数中通过analyzer属性来指定分词器,取值可以是IK分词器提供的ik_smartik_max_word,例如:

### 测试分词 -- 中文 -- ik_smart
GET http://localhost:9200/_analyze
Content-Type: application/json

{
  "analyzer": "ik_smart",
  "text": "很高兴认识你!"
}

### 测试分词 -- 中文 -- ik_max_word
GET http://localhost:9200/_analyze
Content-Type: application/json

{
  "analyzer": "ik_max_word",
  "text": "很高兴认识你!"
}

使用IK分词器时,可以自造词!例如:
在config目录下,创建一个dic为后缀名的文本文档,写入自造词,然后在xml文档中添加该文档的配置,重启即可

Elasticsearch文档数据库的相关概念

索引(index / indices)

  • 相当于MySQL中的Database

类型(type / types)

  • 相当于MySQL中的Table,可以自行创建“类型”,或者,如果不关心“类型”,使用 _doc 表示类型名
  • ES本身并不注重“类型”的概念,甚至在较高版本(8.x或以上)基本已废弃此概念

文档(document / documents)

  • 相当于MySQL中各数据表中一行行的数据
  • 在ES中每个数据都是由JSON格式组织的

字段(field / fields)

  • 相当于MySQL中的Column

基于RESTful访问Elasticsearch

操作汇总

添加文档

添加文档(使用ES随机生成的ID值)

请求格式:

POST http://localhost:9200/{索引名}/{类型名}

提示:添加文档时,如果索引不存在,会自动创建索引,如果类型不存在,会自动创建类型!

请求示例:

### 添加文档
POST http://localhost:9200/index_crud/_doc
Content-Type: application/json

{
  "id": 998,
  "title": "2023新茶上市,赔本大甩卖",
  "sort": 188
}

添加文档(自行指定ID值)

请求格式:

PUT http://localhost:9200/{索引名}/{类型名}/{文档ID}

请求示例:

### 添加文档(自行指定ID值)
PUT http://localhost:9200/index_crud/_doc/Tea9527
Content-Type: application/json

{
  "id": 999,
  "title": "2023老茶上市,卖得也相当不错",
  "sort": 199
}

删除

根据ID删除文档

请求格式:

DELETE http://localhost:9200/{索引名}/{类型名}/{文档ID}

请求示例:

### 根据ID删除文档
DELETE http://localhost:9200/index_crud/_doc/Tea9527

提示:如果尝试删除的文档不存在,将响应404错误!

删除索引

请求格式:

DELETE http://localhost:9200/{索引名}

请求示例:

### 删除索引
DELETE http://localhost:9200/index_crud

提示:如果尝试删除的索引不存在,将响应404错误!

修改文档

修改文档(更新整篇文档)

请求格式:

PUT http://localhost:9200/{索引名}/{类型名}/{文档ID}

请求示例:

### 修改文档(更新整篇文档)
PUT http://localhost:9200/index_crud/_doc/Tea9527
Content-Type: application/json

{
  "id": 999,
  "title": "2023老茶上市,卖得也相当不错",
  "sort": 199,
  "description": "这个老茶味道很好,强烈推荐!"
}

注意:以上做法将使用请求参数替换原有的整篇文档!

修改文档(局部修改)

请求格式:

POST http://localhost:9200/{索引名}/{类型名}/{文档ID}/_update

请求参数:

{
	"doc": {
        需要更新的数据的参数
    }
}

请求示例:

### 修改文档(局部修改)
POST http://localhost:9200/index_crud/_doc/Tea9527/_update
Content-Type: application/json

{
  "doc": {
    "sort": 189,
    "description": "老茶和新茶味道还是挺不一样,要不,买个试试?"
  }
}

注意:如果请求参数中包含新的属性(原文档中没有的属性),也会更新成功,且在文档中新增新的属性!

查看文档

查看某个索引中的所有文档

请求格式

GET http://localhost:9200/{索引名}/_search

请求示例:

### 查看某个索引中的所有文档
GET http://localhost:9200/index_crud/_search

根据ID访问文档

请求格式

GET http://localhost:9200/{索引名}/{类型名}/{文档ID}

请求示例:

### 根据ID访问文档
GET http://localhost:9200/index_crud/_doc/yjEl3okBucTgSd_ILGK2

Elasticsearch中的数据类型

在Elasticsearch中,各字段的值也是有数据类型的,大致为:

  • 字符串类型:textkeyword
    • text类型在被处理时,默认会被分词
      • 默认
    • keyword类型在被处理时,默认不会被分词
  • 数值类型:byteshortintegerlongfloatdouble
  • 布尔类型:boolean
  • 日期类型:date

例如,准备一些测试数据:

ID(id)标题(title)简介(description)排序序号(sort)售价(price)
1散装龙井好喝又实惠160300
2大红袍大礼包性价比之王190688
3龙井礼盒送礼必备130888
4精装陈年老普洱收藏珍品150988
5精装铁观音大礼包家中常备160700

在使用Elasticsearch时,应该先手动创建索引,并确定此索引中的文档有哪些字段,及字段的数据类型!

请求格式:

### 自定义索引及其文档的属性和数据类型
PUT http://localhost:9200/{索引名}
Content-Type: application/json; charset=UTF-8

{
	"mappings": {
		"properties": {
			"{字段名1}": {
				"type": "{字段类型1}",
				"analyzer": "{分词器名称,仅用于text类型的字段}"
			},
			"{字段名2}": {
				"type": "{字段类型2}"
			},
			... ...
			"{字段名n}": {
				"type": "{字段类型n}"
			}
		}
	}
}

请求示例:

### 自定义索引及其文档的属性和数据类型
PUT http://localhost:9200/index_search
Content-Type: application/json; charset=UTF-8

{
  "mappings": {
    "properties": {
      "id": {
        "type": "long"
      },
      "title": {
        "type": "text",
        "analyzer": "ik_max_word"
      },
      "description": {
        "type": "keyword"
      },
      "sort": {
        "type": "long"
      },
      "price": {
        "type": "long"
      }
    }
  }
}

插入测试数据示例:

### 添加文档--测试数据1
PUT http://localhost:9200/index_search/_doc/1
Content-Type: application/json

{
  "id": 1,
  "title": "散装龙井",
  "description": "好喝又实惠",
  "sort": 160,
  "price": 300
}

### 添加文档--测试数据2
PUT http://localhost:9200/index_search/_doc/2
Content-Type: application/json

{
  "id": 2,
  "title": "大红袍大礼包",
  "description": "性价比之王",
  "sort": 190,
  "price": 688
}

### 添加文档--测试数据3
PUT http://localhost:9200/index_search/_doc/3
Content-Type: application/json

{
  "id": 3,
  "title": "龙井礼盒",
  "description": "送礼必备",
  "sort": 130,
  "price": 888
}

### 添加文档--测试数据4
PUT http://localhost:9200/index_search/_doc/4
Content-Type: application/json

{
  "id": 4,
  "title": "精装陈年老普洱",
  "description": "收藏珍品",
  "sort": 150,
  "price": 988
}

### 添加文档--测试数据5
PUT http://localhost:9200/index_search/_doc/5
Content-Type: application/json

{
  "id": 5,
  "title": "精装铁观音大礼包",
  "description": "家中常备",
  "sort": 160,
  "price": 700
}

搜索

简单的搜索

请求格式:

GET http://localhost:9200/{索引名}/_search?q={字段名:查询关键字}

请求示例:

### 根据关键字执行简单的搜索
GET http://localhost:9200/index_search/_search?q=title:龙井

高级搜索

### 高级搜索:自定义query,在query属性下配置match属性,在match属性下再配置搜索的字段名与关键字
GET http://localhost:9200/index_search/_search
Content-Type: application/json

{
  "query": {
    "match": {
      "title": "龙井"
    }
  }
}

### 高级搜索:多条件搜索:自定义query,在query属性下配置bool属性,在bool属性下再配置must,must的值是数组,数组元素就是匹配规则,must下的多个规则必须同时匹配才能被搜索到
### 除了must以外,还可以是should,should只需要匹配其中任意1个条件即可
### 另外,还可以是must_not,即不允许是某种规则
### must >>> AND
### should >>> OR
### must_not >>> !=
GET http://localhost:9200/index_search/_search
Content-Type: application/json

{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": "龙井"
          }
        },
        {
          "match": {
            "description": "送礼必备"
          }
        }
      ]
    }
  }
}

### 高级搜索:查询指定字段的数据,在query同级配置_source,此属性的值是数组,用于指定字段列表
GET http://localhost:9200/index_search/_search
Content-Type: application/json

{
  "query": {
    "match_all": {}
  },
  "_source": [
    "id",
    "title",
    "price"
  ]
}

### 高级搜索:指定排序,在query同级配置sort属性,在sort属性中配置排序规则,默认根据字段值升序排列,也可以配置order属性来指定规则,取值为desc时为降序
GET http://localhost:9200/index_search/_search
Content-Type: application/json

{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "sort": {},
      "id": {
        "order": "desc"
      }
    }
  ]
}

### 高级搜索:分页搜索,在query同级配置from和size属性
GET http://localhost:9200/index_search/_search
Content-Type: application/json

{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "id": {}
    }
  ],
  "from": 1,
  "size": 3
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值