Elasticsearch
文章平均质量分 89
Moutai码哥
广漂一枚,认真做好技术,等混不下去就回家卖酒,哈哈...
展开
-
ES使用Ngram分词器实现wildcard高性能替代方案
## 3.1 Ngram定义Ngram是一种基于统计语言模型的算法。Ngram的基本思想:是将文本里面的内容按照字节进行大小为N的滑动窗口操作,形成了长度是N的字节片段序列。每一个字节片段称为gram,对所有gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间,列表中的每一种gram就是一个特征向量维度。该模型基于这样一种假设,第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。原创 2022-05-03 21:42:34 · 5591 阅读 · 0 评论 -
【数据平台】Elasticsearch-调优实践
Elasticsearch调优垃圾回收实现目标:需要实现是小而多次的垃圾回收,而不是一次长时间的回收,从而保证应用在稳定的性能水平运行。1.1 JVM调优1.1.1 使用jstat命令:jstat -gcutil pid 2000 1000gcutils:表示监控垃圾回收器的工作;2000:毫秒表示的采样周期;1000:是采样的数量;显示结果:S0 S1 E O P YGC YGCT FGC FGCT GCT调优分析(先年轻代,后老年代)当S0、S2或者E列显示为1原创 2021-03-08 23:44:19 · 894 阅读 · 1 评论 -
【商城】Elasticsearch搜索引擎-02.构建智能搜索系统客户端-实战
众所周知,Elasticsearch作为搜索引擎被广泛应用在各个领域,尤其是电子商务网站和App的检索,如下几乎囊括的商城大部分搜索使用场景查询定义,而索引时Elasticsearch搜索核心概念之一,Elasticsearch底层使用倒排索引对分词进行映射,默认使用大数据常用的相似推荐算法(TF-IDF)进行评分,既实现文档高效检索,又完成文档排序。在上一篇构建搜索系统之查询-实战基础上,本章将说明如何定义索引,并实现完整检索客户端。1.索引定义下面以实战商品搜索为例,说明复杂的商品索引定义,常用关键原创 2021-03-07 21:57:42 · 392 阅读 · 0 评论 -
【商城】Elasticsearch搜索引擎
Elasticsearch作为商城核心框架,主要应用在商城搜索、商品搜索、订单搜索、店铺搜索等搜索场景,起到支撑核心业务的重要作用。下面以为Elasticsearch 6.x为例搭建一套完整的搜索引擎。系统参数配置(1)打开/etc/security/limits.conf,在文件末尾,修改对应参数soft nofile 65536, 可以适当增大到2倍;hard nofile 65536, 可以适当增大到2倍;(2)配置虚拟内存大小打开/etc/sysctl.conf在文件最后添加一行原创 2021-01-16 15:38:15 · 737 阅读 · 2 评论 -
【商城】Elasticsearch搜索引擎-01.构建智能搜索系统之查询-实战
我们都知道,Elasticsearch作为搜索引擎被广泛应用在各个领域,尤其是电子商务商城检索,如下几乎囊括的商城大部分搜索使用场景查询定义,其中包括:基本查询:简单的查询方式terms:目标列包含指定词(不分词)match:会把输入的“短语”进行分解成分词,分词器可自定义bool match:match分解成多个词,并且是and的关系,默认是or的关系match phrase:进行分词,但要指定分词之间词语的个数match phrase prefix:进行分词,分词按前缀匹配multi-m原创 2021-02-21 21:00:19 · 540 阅读 · 1 评论