
搜索
文章平均质量分 69
搜索
u013250861
这个作者很懒,什么都没留下…
展开
-
ElasticSearch-7.17支持两种客户端连接方式(RestHighLevelClient 和Elasticsearch Java API)
学习es时发现了一个大问题,学习的版本为7.8.0(尚硅谷yyds),自己使用的是7.17.8,但是最新的版本已经是8.5X了(心累,怎么升级这么快)。 因为目前用的还是jdk1.8,所以就按照7.17.8的版本 RestHighLevelClient 创建连接,但是从7.15.0版本开始ES官方已经不推荐Rest客户端了,所以查了一下官网,发现Elasticsearch Java API 客户端(全新的客户端库),可以和 RestHighLevelClient 兼容使用,官方原文:避免在过渡原创 2022-12-07 18:58:56 · 2049 阅读 · 0 评论 -
Elasticsearch入门(三)高级查询操作
先把上一个内容的 索引删除掉在 Postman 中,向 ES 服务器发 请求:在 Postman 中,向 ES 服务器发五个 请求:x分别是1,2,3,4,5,6,每次请求携带自己的请求体,请求体内容在下方代码块里 本内容基本都是对请求体进行配置,也是 ElasticSearch 的语法核心所在。查询都是用 请求。http://127.0.0.1:9200/student/_search请求体内容: 结果: http://127.0.0.1:9200/st原创 2022-12-07 18:58:05 · 1096 阅读 · 0 评论 -
Elasticsearch入门(二)基本操作(索引、文档、映射)
Elasticsearch 是面向文档型数据库,一条数据在这里就是一个文档。为了方便大家理解,我们将 Elasticsearch 里存储文档数据和关系型数据库 MySQL 存储数据的概念进行一个类比ES 里的 Index 可以看做一个库,而 Types 相当于表,Documents 则相当于表的行。这里 Types 的概念已经被逐渐弱化,Elasticsearch 6.X 中,一个 index 下已经只能包含一个type,Elasticsearch 7.X 中, Type 的概念已经被删除了。用 JSON原创 2022-12-07 18:55:40 · 212 阅读 · 0 评论 -
Elasticsearch入门(一)基本介绍与安装
Elaticsearch:简称为 ES,ES 是一个开源的高扩展的分布式全文搜索引擎,是整个 Elastic Stack 技术栈的核心。它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理 PB 级别的数据。我们要是进行全文检索项目的开发,建议优先考虑elasticsearch。全文索引:它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式原创 2022-12-07 18:53:09 · 306 阅读 · 0 评论 -
Elasticsearch-相关性算分:BM25算法【对TFIDF算法的优化;即:词频超过一定数量,超过的那部分不进行算分】【ES5.0之前默认的相关性算法是 TF-IDF,之后则默认采用BM25】
相关性算分:指文档与查询语句间的相关度,通过倒排索引可以获取与查询语句相匹配的文档列表如何将最符合用户查询需求的文档放到前列呢?本质问题是一个排序的问题,排序的依据是相关性算分,确定倒排索引哪个文档排在前面影响相关度算分的参数:1、TF(Term Frequency):词频,即单词在文档中出现的次数,词频越高,相关度越高2、Document Frequency(DF):文档词频,即单词出现的文档数3、IDF(Inverse Document Frequency):逆向文档词频,与文档词频相反,即原创 2022-03-01 19:44:25 · 1168 阅读 · 0 评论 -
搜索排序算法:评估方法【平均排序倒数(MRR)、平均准确率 (MAP)、NDCG】
参考资料:问答系统评测方法原创 2022-02-23 23:15:00 · 1380 阅读 · 0 评论 -
搜索引擎:OpenSearch【结构化数据搜索托管服务】【特点:单应用亿级别文档搜索 ,毫秒级别查询延迟 ,万级别QPS】
阿里云开放搜索(OpenSearch)是一款结构化数据搜索托管服务,其能够提供简单、高效、稳定、低成本和可扩展的搜索解决方案。OpenSearch以平台服务化的形式,将专业搜索技术简单化、低门槛化和低成本化,让搜索引擎技术不再成为客户的业务瓶颈,以低成本实现产品搜索功能并快速迭代。本文将为大家介绍OpenSearch的最新推出的电商查询语义理解和搜索算法平台两个新功能。参考资料:OpenSearch最新功能介绍Opensearch架构及引擎原理...原创 2022-02-20 23:39:40 · 317 阅读 · 0 评论 -
Java架构师-分布式(三):分布式搜索引擎-Elasticsearch【倒排索引;从其他数据库同步数据】
# 一、Elasticsearch 概述Elasticsearch 是一个分布式的免费开源搜索和分析引擎,适用于包括文本、数字、地理空间、结构化和非结构化数据等在内的所有类型的数据。Elasticsearch 在 Apache Lucene 的基础上开发而成,由 Elasticsearch N.V.(即现在的 Elastic)于 2010 年首次发布。Elasticsearch 以其简单的 REST 风格 API、分布式特性、速度和可扩展性而闻名,是 Elastic Stack 的核心组件;Elast原创 2021-06-01 21:59:34 · 532 阅读 · 0 评论 -
跨模态检索研究文献综述(二)
随着互联网技术的蓬勃发展和智能设备的普及,多媒体数据在数量爆炸式增长的同时,其形态也越来越多样化。人们获取信息的需求已经不满足于单一模态的数据检索,通过不同模态的知识协同实现跨模态的检索成为近几年研究的热点。在深入了解分析跨模态检索研究背景和研究进展的基础上,以跨模态检索的关键技术——公共子空间建模为主线,对跨模态检索技术的三大类方法传统统计分析方法、深度学习方法与哈希学习方法,从不同角度对研究内容、关键技术、局限性、适用性和特点等方面进行了全方位、多角度的对比分析,并进行了实验以更深入地对比。最后,对原创 2022-01-18 22:38:55 · 1021 阅读 · 0 评论 -
跨模态检索研究进展综述【跨模态检索的核心工作在于:①不同模态数据的特征提取、②不同模态数据之间内容的相关性度量】【主流研究方法:基于传统统计分析的技术、基于深度学习的技术】【哈希编码提高检索速度】
随着互联网上多媒体数据的爆炸式增长,单一模态的检索已经无法满足用户需求,跨模态检索应运而生.跨模态检索旨在以一种模态的数据去检索另一种模态的相关数据。跨模态检索的核心任务是:数据特征提取 和 不同模态数据之间内容的相关性度量。文中梳理了跨模态检索领域近期的研究进展,从以下角度归纳论述了跨模态检索领域的研究成果.:传统方法;深度学习方法;手工特征的哈希编码方法;深度学习的哈希编码方法在此基础上,对比分析了各类算法在跨模态检索常用标准数据集上的性能。最后,分析了跨模态检索研究存在的问题,并对原创 2022-01-18 22:24:44 · 9250 阅读 · 0 评论