搜索引擎
文章平均质量分 92
搜索引擎
爱吃牛肉的大老虎
学无止境,既要有深度又要有广度地学习
展开
-
Easy-Es操作Elasticsearch
Easy-Es(简称EE)是一款基于(简称ES)官方提供的打造的ORM开发框架,在的基础上,只做增强不做改变,为简化开发、提高效率而生。EE和(简称MP)的用法非常相似,如果你之前使用过MP的话,应该能很快上手EE。EE的理念是:把简单、易用、方便留给用户,把复杂留给框架。全自动索引托管:开发者无需关心索引的创建、更新及数据迁移等繁琐步骤,框架能自动完成。屏蔽语言差异:开发者只需要会MySQL的语法即可使用ES。代码量极少:与直接使用官方提供的相比,相同的查询平均可以节省3-5倍的代码量。原创 2024-01-30 09:33:50 · 1324 阅读 · 0 评论 -
Windows环境安装Elasticsearch和Kibana
如果是高版本,则需要以https的方式访问:https://127.0.0.1:9200/,同时还得留意启动时日志的用户名+密码。如果是 低版本访问,直接访问 http://127.0.0.1:9200/在性能上是完全相同的,但对于提高查询简洁性和清晰度有很大帮助。把下载的zip包随便放个位置,比如在解压文件夹下,使用bin目录中的。如果一次查询只有过滤,没有查询条件,不希望进行评分,我们可以使用。有了相当多的数据之后,进行分析这些数据用的工具。,这才是正规的修改,其实和修改文档1 效果一样的。原创 2023-05-03 19:09:12 · 2078 阅读 · 1 评论 -
Elasticsearch之JavaAPI操作ES
1.2 示例Demo1.3 操作文档用的的实体:主要操作逻辑:当在操作文档时,如果提示含有type的过时了,可把type参数去掉点击了解Elasticsearch为什么要去除 表 type此时 需要另外引入的pom1.4.1 实体和工具类工具类原创 2023-04-27 14:15:43 · 532 阅读 · 0 评论 -
Solr之查询页面,索引,SolrJ
自动检测文件夹中的内容类型,但将其限制为 PPT 和 HTML 文件并将其索引到 gettingstarted。自动检测文件夹中的内容类型,并对其进行递归扫描,以便为编入 gettingstarted 的文档进行索引。文件是什么类型的内容。的字段类型必须是 DateField( 或其子类型 ). 需要注意的是 , 使用。)参数是需要将文件视为正确的类型,否则将被忽略,并记录一个警告,因为它不知道。工具),用于将各种类型的内容发布到 Solr 服务器。元素中的属性是随意的,这主要取决于。原创 2023-04-20 13:46:42 · 1386 阅读 · 0 评论 -
Lucene之使用详解分析
Lucene是家族中的一个开源项目,它不是一个完整的搜索应用程序,但可为我们的应用程序提供索引和搜索功能。Lucene也是目前流行的基于Java的开源全文检索工具包。目前已有很多应用程序基于Lucene实现了搜索功能,比如 Eclipse 帮助系统的搜索功能。Lucene能为文本类型的数据建立索引,我们只要能把需要建立索引的数据转化为文本格式,Lucene就能对该文档建立索引并实现搜索。分词器指的是搜索引擎如何使用关键字进行匹配,如 入门 中的关键字:护眼带光源。如果使用like,那么%护眼带光源%原创 2023-04-19 17:18:00 · 917 阅读 · 0 评论 -
Elasticsearch之Linux环境安装介绍
在决定使用 的时候首先要考虑的是版本问题, (排除 0.x 和 1.x)目前有如下常用的稳定的主版本:。可能会发现没有 , 从 2.4.6 直接跳到了 5.0.0。其实是为了 技术栈的版本统一,免的给用户带来混乱。在 是 (2.x 的最后一版 2.4.6 的发布时间是 July 25, 2017) 的情况下,Kibana 已经是 4.x(Kibana 4.6.5 的发布时间是 July 25, 2017)。那么在 Kibana 的下一主版本肯定是 5.x 了,所以 Elasticsearch 直接转载 2022-12-07 10:41:45 · 522 阅读 · 0 评论 -
Elasticsearch之原理详解
是使用 编写的一种开源搜索引擎,它在内部使用 做索引与搜索,通过对 的封装,隐藏了 的复杂性,取而代之的提供一套简单一致的 然而, 不仅仅是 ,并且也不仅仅只是一个全文搜索引擎。它可以被下面这样准确的形容:官网对 的介绍是 是一个分布式、可扩展、近实时的搜索与数据分析引擎。其中主要有如下几个核心术语需要理解:和是 中很重要的两种数据结构,是实现快速检索的重要基石。和是分两部分存储的,而上 支持 级全文搜索,当索引上的数据量太大的时候, 通过水平拆分的方式将一个索引上的数据拆分出来分配到不同转载 2022-12-06 18:00:08 · 317 阅读 · 0 评论 -
搜索引擎之Lucene,Solr,ElasticSearch比较
全文搜索引擎是目前广泛应用的主流搜索引擎。它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。那么,到底是选择Solr还是?有时很难找到明确的答案。无论选择Solr还是,首先需要了解正确的用例和未来需求,总结它们的每个属性。由于易于使用,在新开发者中更受欢迎。但是,如果已经习惯了与Solr。转载 2022-12-01 16:33:55 · 429 阅读 · 0 评论 -
SpringBoot整合ElasticSearch
大致流程创建对应的请求 --> 设置请求(添加规则,添加数据等) --> 执行对应的方法(传入请求,默认请求选项)–> 接收响应结果(执行方法返回值)–> 输出响应结果中需要的数据(source,status等)注意事项如果不指定id,会自动生成一个随机id正常情况下,不应该这样使用,如果索引发生改变了,那么代码都需要修改,可以定义一个枚举类或者一个专门存放常量的类,将变量用final static等进行修饰,并指定索引值。其他地方引用该常量即可,需要修改也只需修改该类即可。转载 2022-11-30 19:07:47 · 1615 阅读 · 1 评论 -
Solr之配置文件Solrconfig.xml和solr.xml说明
在中文件是影响本身参数最多的配置文件。在中,需要配置下述的一些重要的功能,如:默认情况下,将其索引数据存储在一个名为的目录下中,该目录位于核心的实例目录下()。如果想要指定不同的目录来存储索引数据,则可以在文件中为核心配置,或使用文件中的参数。可以使用绝对路径或相对于的的路径名指定另一个目录。例如:所述取代将导致当前核心的名称被取代,这导致每个核心的数据被保持在一个单独的子目录中。如果使用复制来复制索引(如传统扩展和分发中所述),那么该目录应该对应于复制配置中使用的索引目录。如果定义了环境变量 ,或者为转载 2022-06-15 15:59:18 · 1531 阅读 · 0 评论 -
Solr之检索原理和整合mysql
场景:小时候我们都使用过新华字典,老师叫你翻开第38页,找到“学习”所在的位置,此时你会怎么查呢?毫无疑问,你的眼睛会从38页的第一个字开始从头至尾地扫描,直到找到“学习”二字为止。这种搜索方法叫做。对于少量的数据,使用顺序扫描是够用的。但是老师叫你查出学习的“学”字在哪一页时,你要是从第一页的第一个字逐个的扫描下去,那就是问题了。此时就需要用到索引。索引记录了“学”字在哪一页,只需在索引中找到“学”字,然后找到对应的页码,答案就出来了。因为在索引中查找“学”字是非常快的,因为你知道它的偏旁,因此也就可迅速原创 2022-06-14 18:11:34 · 387 阅读 · 0 评论 -
Solr之基础讲解入门
采用搜索库为核心,提供全文索引和搜索开源企业平台,提供的和的,本教程以作为测试环境,jdk版本需要1.7及以上版本Solr 可从https://solr.apache.org/downloads.html获得:最新版 Solr 下载。有三个独立的包:解压:解压后目录布局:解压后进入进入目录执行 命令,命令行显示如下,启动成功,默认端口,也可通过指定端口启动浏览器访问:,你看到的就是的管理界面关闭使用命令如果没有使用示例配置启动,则需要创建一个核心才能进行索引和搜索,在创建后通过 查看状态就是的一个原创 2022-06-10 16:30:43 · 1889 阅读 · 0 评论