Windows下安装ElasticSearch
先安装 java的sdk 环境变量也要配上 JAVA_HOME
1.ElasticSearch下载地址:
https://www.elastic.co/downloads/elasticsearch
没有意外情况的话点击bin里面的bat就能 正常运行
查看正常运行 就查看本机的9200端口 返回json就是正常运行
分词器
高版本自带中文分词器
加入ik 中文 分词器 才能正常运行
bin目录下运行cmd 加入分词器
elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/vX.X.X/elasticsearch-analysis-ik-X.X.X.zip
索引可视化
当数据存储到Elasticsearch后,我们希望能方便的通过界面进行查询,有两个工具能够满足我们的需要,一个是Elasticsearch-head插件,另一个是Kibana,笔者认为两个工具各有千秋,大家可以自行体会,不过就安装步骤来说,Elasticsearch-head真心麻烦,本文主要介绍如何部署Kibana,并使用Kibana来查看Elasticsearch中的索引数据。
补充
首页搜索博客的时候搜索结果不太理想,还不如数据库Like呢 现在使用的是 ik_smart 搜索精准但是不输入整个词不太容易搜索出来,凑合用吧以后忍不了的时候调优 参考 地址 https://www.cnblogs.com/liang1101/p/13189005.html
这里介绍的优化是基于 ik 分词源码的优化。首先,我们知道,ik 分词默认有两种分词模式,分别为:ik_max_word 和 ik_smart
这里针对这两种分词方式分别存在的问题有:
ik_max_word :最细粒度分词方式
分的太细了,召回率确实很高,但是会导致召回的内容存在语义问题。例如,北京的一天,召回了 南京的游玩,或者任何地方的一天等等。
ik_smart:最粗颗粒度分词方式
1. 分的太粗,保证了召回的精准性,但是召回率却很低。
2. 存在歧义,导致召回了不是想要的结果集,例如:广西北海 --> 广西 | 西北 | 北海,找回去了西北相关的数据。
个人博客地址