下载文件
关于Elasticsearch
Elaticsearch是专门用于解决搜索问题的NoSQL的文档数据库。
无论使用哪种操作系统,只需要下载elasticsearch的压缩包并解压即可使用,需要注意,elasticsearch文件夹的各层级的父级文件夹的名称中不允许包含非ASCII码字符和空格!例如放在D盘根目录下:
执行`bin`目录下的`elasticsearch`即可启用Elasticsearch服务:
启动成功后,效果大致如下:
注意:在使用Elasticsearch的过程中,以上窗口不可关闭!
当启动成功后,你可以通过浏览器访问 http://localhost:9200,页面显示内容如下:
elasticsearch提供了一套基于RESTful的访问,你可以使用任何一种可以提交REST请求的工具来访问elasticsearch及其中的数据,例如常见的测试工具PostMan等。
或者,你也可以在IntelliJ IDEA中,使用HTTP Request进行访问:
在HTTP Request文件中编写需要提交的请求,然后,点击左侧的运行图标即可发起请求
使用elasticsearch分词
Elasticsearch之所以能够高效处理搜索,是因为它会将你的数据进行“分词”处理,即将一段文本拆成若干个文本,在执行搜索时,会尝试检查是否匹配“拆”出来的某个文本。
向 http://localhost:9200/_analyze 提交请求即可分词,并且,请求中必须包含请求参数,参数名称固定为text
,整个请求的格式大致如下:
提示:在同一个`.http`文件中,可以编写多个请求,但是,后续的请求的代码必须使用 `###` 和前序的请求分开,不能只使用1个 `#`!
你也可以尝试对中文的句子进行分词,会发现,在默认情况下,Elasticsearch只能将中文中的每个字拆出来,并不能正确的处理各个词语!
示例代码:
### 测试分词 -- 中文
GET http://localhost:9200/_analyze
Content-Type: application/json
{
"text": "很高兴认识你!"
}
可以在Elasticsearch中添加新的分词插件来解决以上问题,经典的中文分词插件就是ik分词器。
所有插件都应该放在Elasticsearch下的plugin文件夹下:
你需要将下载得到的ik分词器的压缩包解压出来,将解压得到的文件夹放在`plugins`文件夹下,而ik分词器的文件夹名称就叫`ik`即可:
<