倒排索引
以字或词为关键字进行索引,表中关键字所对应的记录表项,记录了出现这个字或词的所有文档,每一个表项记录该文档的编号和关键字在该文档中出现的位置情况。
效果:从海量数据中快速获取需要的信息
底层API:lucene
具体实现的搜索产品:elasticsearch,solr
elasticsearch的安装
elasticsearch:https://www.elastic.co/cn/downloads/past-releases#elasticsearch
kibana:https://www.elastic.co/cn/downloads/past-releases#kibana
ik分词器:https://github.com/medcl/elasticsearch-analysis-ik/releases
注意:kibana、elasticsearch和IK分词器的版本号要一致,否则可能带来兼容性问题
另外,需要jdk1.8以上环境。
-
安装elasticsearch:
rpm -ivh elasticsearch-6.8.1.rpm
-
为elasticsearch配置jdk:
vim /etc/sysconfig/elasticsearch
-
切换到/etc/elasticsearch目录下,看到两个配置文件jvm.options和elasticsearch.yml
-
首先修改jvm.options。elasticsearch默认占用所有内存,导致虚拟机很慢,可以改的小一点。Xms和Xmx要一致
-
修改elasticsearch.yml配置文件。默认只允许本机访问,修改为0.0.0.0后则可以远程访问;端口使用默认:9200
-
把bootstrap自检程序关掉
-
配置集群列表,这里只有一个。可以配置计算机名
启动
启动elasticsearch:systemctl start elasticsearch
测试
curl http://localhost:9200
在浏览器端测试:输入虚拟机网址加端口号