文章目录
什么是Elasticsearch
node & cluster
Elastic 本质上是一个分布式数据库,允许多台服务器协同工作,每台服务器可以运行多个 Elastic 实例。
单个 Elastic 实例称为一个节点(node)。一组节点构成一个集群(cluster)。
index
Elastic 会索引所有字段,经过处理后写入一个反向索引(Inverted Index
)。查找数据的时候,直接查找该索引。
所以,Elastic 数据管理的顶层单位就叫做 Index(索引)
。它是单个数据库的同义词。每个 Index (即数据库)的名字必须是小写。
下面的命令可以查看当前节点的所有 Index。
curl -X GET 'http://localhost:9200/_cat/indices?v'
#health status index uuid pri rep docs.count docs.deleted ...
Document
Index 里面单条的记录称为 Document(文档)。许多条 Document 构成了一个 Index。
Document 使用 JSON 格式表示,下面是一个例子。
{
"user": "张三",
"title": "工程师",
"desc": "数据库管理"
}
同一个 Index 里面的 Document,不要求有相同的结构(scheme),但是最好保持相同,这样有利于提高搜索效率。
Type
Document 可以分组,比如weather这个 Index 里面,可以按城市分组(北京和上海),也可以按气候分组(晴天和雨天)。这种分组就叫做 Type,它是虚拟的逻辑分组,用来过滤 Document。
不同的 Type 应该有相似的结构(schema)
,举例来说,id字段不能在这个组是字符串,在另一个组是数值。这是与关系型数据库的表的一个区别。性质完全不同的数据(比如products和logs)应该存成两个 Index,而不是一个 Index 里面的两个 Type(虽然可以做到)。
下面的命令可以列出每个 Index 所包含的 Type。
curl 'localhost:9200/_mapping?pretty=true'
根据规划,Elastic 6.x 版只允许每个 Index 包含一个 Type,7.x 版将会彻底移除 Type。
安装Elasticsearch
拉取image
docker pull docker.elastic.co/elasticsearch/elasticsearch:6.8.7
你也可以下载其他的镜像,网址:https://www.docker.elastic.co.
命令行方式启动
docker run -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" \
docker.elastic.co/elasticsearch/elasticsearch:6.8.7
修改配置
要想后续能够使用可视化工具Elasticsearch-head连接Elasticsearch,就需要设置elsaticsearch跨域发给访问。
允许跨域访问,需要修改一些参数。
1)使用以下命令进入es的bash(es是运行容器时指定的name,也可以用CONTAINER ID)进入容器内部。
docker container ls -l
docker exec -it es /bin/bash
2)在文件config/elasticsearch.yml后面添加以下内容
http.cors.enabled: true
http.cors.allow-origin: "*"
3)使用docker restart es命令重启ES。
浏览器打开http://localhost:9200,可以看到如下内容
安装elasticsearch-head插件
1、下载镜像
docker pull mobz/elasticsearch-head:5
2、运行容器
docker run -d --name es_admin -p 9100:9100 mobz/elasticsearch-head:5
3、设置外部访问
由于容器里面没有安装vi/vim,所以需要将配置文件拷贝出来修改之后再放回去。
-
使用
docker cp es_admin:/usr/src/app/Gruntfile.js ./
命令将es容器里的文件拷贝到当前目录。 -
修改文件,增加内容
hostname: '0.0.0.0'
,如图
-
使用
docker cp Gruntfile.js es_admin:/usr/src/app/
命令将文件拷贝回去。 -
连接Elasticsearch
浏览器打开http://localhost:9100/,如果配置正常,就可以看到下图
安装中文分词器插件ik
1、下载插件压缩包
wget https://github.com/medcl/elasticsearch-analysis- ik/releases/download/v6.3.2/elasticsearch-analysis-ik-6.3.2.zip
2、将压缩包拷贝到es容器内部
- 进入es容器内部,并创建插件目录。
docker container ls docker exec -it es bash cd plugins mkdir ik exit
- 退回宿主机后,将压缩包拷贝到es容器刚才创建的目录下
docker cp elasticsearch-analysis-ik-6.3.2.zip 98179358f674:/usr/share/elasticsearch/plugins/ik
3)再次进入es容器内部,使用unzip命令将压缩包解压。
[root@98179358f674 ik]# unzip elasticsearch-analysis-ik-6.3.2.zip
到此,中文分词器插件安装完成。
Plugin [analysis-ik] was built for Elasticsearch version 6.3.2 but version 6.8.7 is running
再次启动发现无法启动,网上查到原因是Elasticsearch和ik版本差异。需要elasticsearch.yml中的版本 。此时进不去命令窗口,可以:
docker cp cb6d26a1b7b3:/usr/share/elasticsearch/config/elasticsearch.yml ./
修改完后重新启动Elasticsearch。
{
“settings”: {
“index.number_of_shards”: 1,
“index.number_of_replicas”: 0,
“index.refresh_interval”: “-1”
},
“mappings”: {
“cql_article”: {
“properties”: {
“journal_title”: {
“type”: “text”,
“analyzer”: “ik_max_word”,
“search_analyzer”: “ik_max_word”,
“fielddata”: true,
“fields”: {
“raw”: {
“type”: “keyword”
}
}
},
“journal_volumn”: {
“type”: “text”
},
“title”: {
“type”: “text”,
“analyzer”: “ik_max_word”,
“search_analyzer”: “ik_max_word”,
“boost”: 1.5
},
“author”: {
“type”: “text”
},
“begin_page”: {
“type”: “integer”,
“index”: false
},
“end_page”: {
“type”: “integer”,
“index”: false
},
“publish_date”: {
“type”: “date”,
“format”: “yyyy-MM-dd HH:mm:ss”
},
“publisher”: {
“type”: “text”
}
}
}
}
}
Elasticsearch能做什么
查看
$curl localhost:9200
新建和删除 Index
新建 Index,可以直接向 Elastic 服务器发出 PUT 请求。下面的例子是新建一个名叫weather的 Index。
curl -X PUT 'localhost:9200/weather'
服务器返回一个 JSON 对象,里面的acknowledged字段表示操作成功。
{
"acknowledged":true,
"shards_acknowledged":true
}
然后,我们发出 DELETE 请求,删除这个 Index。
curl -X DELETE 'localhost:9200/weather'
服务器返回
{
"acknowledged":true
}
中文分词设置
curl -X PUT 'localhost:9200/accounts' -d '