Elastic 中国社区官方博客

关于 Elastic Stack 及相关的任何技术

AI

关注

文章平均质量分 94

关注数：文章数：261 文章阅读量：492001 文章收藏量：3488

作者: Elastic 中国社区官方博客

Elastic 首席布道师，Elastic 认证工程师，认证分析师，认证可观测性工程师，阿里云最有价值专家

展开

Elastic 及阿里云 AI 搜索 Tech Day 将于 7 月 27 日在上海举办

参加 Elastic 原厂与阿里云联合举办的 Generative AI 技术交流分享日。借助 The Elastic Search AI Platform，使用开放且灵活的企业解决方案，以前所未有的速度获得搜索最相关的结果。借助强大搜索功能和生成式 AI 的合力，加速商业转化和业务成果。

原创 2024-07-22 17:42:50 · 620 阅读 · 0 评论
使用 Elasticsearch 和 OpenAI 为你的客户成功应用程序构建对话式搜索

在此博客中，我们将探讨如何通过利用大型语言模型 (LLM) 和检索增强生成 (RAG) 等技术实施对话式搜索来增强你的客户成功应用程序。你将了解对话式搜索在客户成功应用程序环境中的优势，以及如何使用 Elasticsearch 有效地实施它。

原创 2024-07-20 21:04:34 · 988 阅读 · 0 评论
Elasticsearch：Retrievers 介绍 - Python Jupyter notebook

在今天的文章里，我是继上一篇文章 “Elasticsearch：介绍 retrievers - 搜索一切事物” 来使用一个可以在本地设置的 Elasticsearch 集群来展示 Retrievers 的使用

原创 2024-07-19 22:00:07 · 1272 阅读 · 0 评论
Elasticsearch 中的位向量

从 Elasticsearch 中的向量搜索开始，我们就支持浮点值（float）。在 8.6 版中，我们添加了对字节（byte）编码向量的支持。在 8.14 版中，我们添加了自动量化到半字节值（half-byte）的功能。在 8.15 版中，我们添加了对位（bit）编码向量的支持。但是，什么是位向量及其实际含义？正如字面上所言，位向量是向量的每个维度都是一个位（bit）。当将向量的数据大小与典型的浮点值进行比较时，位向量的大小减少了 32 倍之多。

原创 2024-07-18 15:32:53 · 1009 阅读 · 1 评论
Elasticsearch：评估搜索相关性 - 第 1 部分

这是一系列博客文章中的第一篇，讨论如何在更好地理解 BEIR 基准的背景下考虑评估你自己的搜索系统。我们将介绍具体的技巧和技术，以便在更好地理解 BEIR 的背景下改进你的搜索评估流程。我们还将介绍导致评估可靠性降低的常见陷阱。最后，我们注意到 LLM 为搜索工程师提供了一个强大的新工具，我们将通过示例展示如何使用它们来帮助评估搜索。

原创 2024-07-18 10:31:04 · 1191 阅读 · 3 评论
Elasticsearch：如何选择向量数据库？

领域是一个快速发展的领域，它正在改变我们管理和搜索数据的方式。与传统数据库不同，向量数据库以向量的形式存储和管理数据。这种独特的方法可以实现更精确、更相关的搜索，并允许在检索中使用机器学习，使向量数据库成为一种非常宝贵的工具。随着我们生成的数据量不断增长，向量数据库在数据管理和搜索中的作用变得越来越重要。这是因为结果的相关性以及能够处理非结构化数据。选择正确的向量数据库可以为你的应用程序带来巨大的变化，但这并不总是一件容易的事。

原创 2024-07-18 08:30:58 · 1121 阅读 · 0 评论
介绍 Elasticsearch 中的 Learning to Tank - 学习排名

从 Elasticsearch 8.13 开始，我们提供了原生集成到 Elasticsearch 中的学习排名 (learning to rank - LTR) 实现。LTR 使用经过训练的机器学习 (ML) 模型为你的搜索引擎构建排名功能。通常，该模型用作第二阶段重新排名器，以提高由更简单的第一阶段检索算法返回的搜索结果的相关性。这篇博文将解释此新功能如何帮助提高文本搜索中的文档排名以及如何在 Elasticsearch 中实现它。

原创 2024-07-16 21:04:11 · 1648 阅读 · 1 评论
Elasticsearch：使用 Amazon Bedrock 的 semantic_text

使用 semantic_text 新功能，并使用 AWS Bedrock 作为推理端点服务。Elasticsearch 的新类型旨在简化构建 RAG 应用程序的常见挑战。它整合了文本分块、生成嵌入以及检索嵌入的步骤。在本文中，我们将使用 Amazon Bedrock 作为我们的推理服务，在不离开 Elastic 的情况下创建一个端到端 RAG 应用程序。

原创 2024-07-14 08:50:43 · 874 阅读 · 0 评论
Elasticsearch：介绍 retrievers - 搜索一切事物

在 8.14 中，Elastic 在 Elasticsearch 中引入了一项名为 “retrievers - 检索器” 的新搜索功能。继续阅读以了解它们的简单性和效率，以及它们如何增强你的搜索操作。检索器是 Elasticsearch 中搜索 API 中添加的新抽象层。它们提供了在单个 _search API 调用中配置多阶段检索管道的便利。此架构通过消除对复杂搜索查询的多个 Elasticsearch API 调用的需求，简化了应用程序中的搜索逻辑。

原创 2024-07-11 20:51:33 · 954 阅读 · 0 评论
实验场：在几分钟内使用 Bedrock Anthropic Models 和 Elasticsearch 进行 RAG 实验

我们最近发布了 Elasticsearch Playground，这是一个新的低代码界面，开发人员可以通过 A/B 测试 LLM、调整提示（prompt）和分块数据来迭代和构建生产 RAG 应用程序。今天，我们宣布 Amazon Bedrock 支持 Playground，为你带来更多来自 Amazon、Anthropic 和其他领先提供商的基础模型选择。

原创 2024-07-11 20:26:45 · 1128 阅读 · 0 评论
Elasticsearch 开放推理 API 增加了对 Amazon Bedrock 的支持

Elasticsearch 开放推理 API 增加了对托管在 Amazon Bedrock 上的模型生成嵌入的支持。Elasticsearch 开放 infereence API 使开发人员能够创建推理端点并使用来自领先提供商的机器学习模型。从今天开始，托管在 Amazon Bedrock 上的模型将通过 Elasticsearch 开放提供。

原创 2024-07-11 13:17:14 · 833 阅读 · 0 评论
使用 Unstructured.io 和 Elasticsearch 向量数据库搜索复杂文档

使用非结构化和 Elasticsearch 向量数据库为 RAG 应用程序提取和搜索复杂的专有文档在使信息可搜索之前解析文档是构建实际 RAG 应用程序的重要步骤。和 Elasticsearch 在此场景中有效地协同工作，为开发人员提供构建 RAG 应用程序的互补工具。提供了一个工具库，用于提取、清理和转换不同格式和不同内容源的文档。

原创 2024-07-09 10:11:23 · 1483 阅读 · 0 评论
Elasticsearch：深度学习与机器学习：了解差异

近年来，两项突破性技术一直站在创新的最前沿 —— 机器学习 (machine learning - ML) 和深度学习 (deep learning - DL)。人工智能 (AI) 的这些子集远不止是流行语。它们是推动医疗保健、金融等各行业进步的关键力量。机器学习具有从数据中学习并做出明智决策的能力，它改变了计算机执行任务的方式，使曾经被认为需要人类智能才能完成的流程自动化。深度学习是机器学习的一个更复杂的，它从人类大脑中汲取灵感，利用神经网络以前所未有的规模消化和学习大量数据。

原创 2024-07-09 09:36:51 · 773 阅读 · 0 评论
生成式人工智能将如何改变网络可访问性

受 Be My Eyes 和 OpenAI 启发的一项实验，尝试使用 ChatGPT 4o 实现网页无障碍。在 Elastic，我们肩负着一项使命，不仅要构建最佳的搜索驱动型 AI 平台，还要确保尽可能多的人喜欢使用该平台。我们相信，开放可访问性不仅可以将我们的受众扩大到新用户，还可以为所有用户带来更好的体验。然而，问题在于，传统的 Web 可访问性虽然出于良好的意图，但却让人感觉像是在圆孔中插入方枘。对于 Kibana 等复杂、视觉堆叠的应用程序来说，情况尤其如此。

原创 2024-07-02 12:13:37 · 1003 阅读 · 0 评论
统一的可观察性和安全性如何增强你的业务？

利用人工智能、异常检测和增强攻击发现功能，在一个平台上增强组织的可观察性和安全性能力当今数字环境中的组织越来越关注服务可用性，并保护其软件免受恶意篡改和攻击。传统的安全和可观察性工具通常以孤岛形式运行，导致观点分散，事件响应延迟。集成可观察性和安全性的统一平台对于加速软件交付和性能以及增强安全性至关重要。利用 AI 和 ML 技术以及先进的攻击发现方法可以显著改善这种集成，从而提供一种全面而主动的方法来管理安全性和应用程序运行状况。

原创 2024-07-01 11:35:13 · 589 阅读 · 0 评论
15 个适用于企业的生成式 AI 用例

关于及其能做什么（和不能做什么）有很多讨论。生成式人工智能（例如大型语言模型 -）利用从大量训练数据中学习到的模式和结构来创建原创内容，而无需存储数据本身。这包括创建文本、软件代码和艺术等。虽然它可以创建内容，但它不会很快。尽管如此，它正在重塑全球行业的格局，从增强网络安全防御到个性化客户体验。事实上，99% 的受访组织表示，。让我们深入研究生成式人工智能如何通过协助使用它的人来释放新的可能性并改变日常业务运营。

原创 2024-06-30 09:07:08 · 1356 阅读 · 0 评论
实验场：在几分钟内使用 Elasticsearch 进行 RAG 应用程序实验

我们很高兴发布我们的 Playground 体验 —- 一个低代码界面，开发人员可以在几分钟内使用自己的私人数据探索他们选择的 LLM。在对对话式搜索进行原型设计时，快速迭代和试验 RAG 工作流的关键组件（例如：混合搜索或添加重新排名）的能力非常重要 —- 以便从 LLMs 获得准确且无幻觉的响应。Elasticsearch 向量数据库和 Search AI 平台为开发人员提供了广泛的功能，例如全面的混合搜索，以及使用来自越来越多的 LLM 提供商的创新。

原创 2024-06-29 17:53:31 · 1405 阅读 · 0 评论
GenAI 用于客户支持 — 第 1 部分：构建我们的概念验证

欢迎来到 Inside Elastic 博客系列，我们将展示 Elastic 的内部运营如何解决实际业务挑战。本系列将揭示我们将生成式 AI（gererative AI - GenAI）集成到客户成功和支持运营中的历程，让你了解我们流程的幕后情况。我们在构建此功能的同时，也在博客中介绍它，我们很高兴你能加入我们的行列！

原创 2024-06-29 17:08:05 · 710 阅读 · 0 评论
Elasticsearch 与 OpenSearch：解开向量搜索性能差距

Elasticsearch 的开箱即用的向量搜索速度比 OpenSearch 快 2 到 12 倍。向量搜索正在彻底改变我们进行相似性搜索的方式，尤其是在人工智能和机器学习等领域。随着向量嵌入模型的日益普及，高效搜索数百万个高维向量的能力变得至关重要。Elastic 收到了来自社区的大量请求，要求我们澄清 Elasticsearch 和 OpenSearch 之间的性能差异，尤其是在语义搜索/向量搜索领域。鉴于这个主题的重要性，我们进行了性能测试，以提供清晰的、数据驱动的比较 —— 没有歧义，只有直截了

原创 2024-06-27 13:11:23 · 1603 阅读 · 3 评论
使用 Elastic ELSER 和 Llama3 的 RAG（使用 Langchain）

在之前的文章 “使用 Llama 3 开源和 Elastic 构建 RAG”，我们讲到了如何使用 Liama3 来结合 Elastic ELSER 来进行 RAG。在今天的文章里，我们来详细使用一个 notebook 来展示如何在本地 Elasticsearch 部署中进行实现。此交互式 notebook 使用 Langchain 处理虚构的工作场所文档，并使用在 Elasticsearch 中运行的 ELSER v2 将这些文档转换为嵌入并将它们存储到 Elasticsearch 中。然后我们提出

原创 2024-06-26 10:33:12 · 1163 阅读 · 0 评论
Elasticsearch：使用 semantic_text 简化语义搜索

semantic_text - 你知道，用于语义搜索！你是否想开始使用语义搜索来搜索数据，但专注于模型和结果而不是技术细节？我们引入了 semantic_text 字段类型，它将处理你所需的细节和基础架构。语义搜索（semantic search）是一种复杂的技术，旨在通过利用机器学习模型来增强搜索结果的相关性。与传统的基于关键字的搜索不同，语义搜索专注于理解单词的含义及其使用的上下文。这是通过应用机器学习模型来实现的，这些模型可以提供对文本的更深入的语义理解。

原创 2024-06-25 15:01:32 · 1253 阅读 · 0 评论
Elasticsearch：使用 Llamaindex 的 RAG 与 Elastic 和 Llama3

这篇文章是对之前的文章 “使用 Llama 3 开源和 Elastic 构建 RAG” 的一个补充。我们可以在本地部署 Elasticsearch，并进行展示。我们将一步一步地来进行配置并展示。你还可以参考我之前的另外一篇文章 “Elasticsearch：使用在本地计算机上运行的 LLM 以及 Ollama 和 Langchain 构建 RAG 应用程序”。

原创 2024-06-25 12:35:53 · 971 阅读 · 0 评论
将 Cohere 与 Elasticsearch 结合使用

本教程中的说明向你展示了如何使用推理 API 使用 Cohere 计算嵌入并将其存储起来，以便在 Elasticsearch 中进行高效的向量或混合搜索。本教程将使用 Python Elasticsearch 客户端执行操作。本教程使用数据集。请参阅，了解使用不同数据集的示例。

原创 2024-06-24 12:50:30 · 1055 阅读 · 0 评论
Elasticsearch：倒数排序融合 - Reciprocal rank fusion - 8.14

此功能处于技术预览阶段，可能会在未来版本中更改或删除。语法可能会在正式发布之前发生变化。Elastic 将努力修复任何问题，但技术预览中的功能不受官方正式发布功能的支持 SLA 约束。倒数排序融合 (reciprocal rank fusion - RRF) 是一种将具有不同相关性指标的多个结果集组合成单个结果集的方法。RRF 无需调整，并且不同的相关性指标不必相互关联即可获得高质量的结果。：在今天的文章中，RFF 有别于之前版本。这个描述是从 8.14.0 开始的。在这个版本之前，请参阅 “

原创 2024-06-21 16:45:19 · 1515 阅读 · 1 评论
使用 Llama 3 开源和 Elastic 构建 RAG

使用开源的 Llama 3 和 Elastic 构建 RAGLlama 3 是 Meta 最近推出的开源大型语言模型。这是 Llama 2 的后继者，根据已发布的指标，这是一个重大改进。与 Gemma 7B Instruct、Mistral 7B Instruct 等最近发布的一些模型相比，它具有良好的评估指标。该模型有两个变体，分别是 80 亿和 700 亿参数。值得注意的是，在撰写这篇博客时，Meta 仍在训练 400B+ 版本的 Llama 3。

原创 2024-06-21 09:34:48 · 978 阅读 · 0 评论
Elasticsearch：不用高深的数学知识来理解 LLMs 是如何工作的

我相信您同意，我们无法忽视生成式人工智能 (GenAI)，因为我们不断被有关大型语言模型 (LLMs) 的主流新闻轰炸。你很可能已经尝试过 ChatGPT，甚至可能一直将其作为助手使用。我认为很多人对 GenAI 革命有一个基本疑问，即这些模型的明显智能来自哪里。在本文中，我将尝试用简单的术语解释生成式文本模型的工作原理，而不使用高级数学，以帮助你将它们视为计算机算法而不是魔法。

翻译 2024-06-20 20:39:43 · 1846 阅读 · 0 评论
使用 Elasticsearch 中的地理语义搜索增强推荐功能

浏览地理和富文本数据是一项重大挑战，尤其是对于景点推荐服务而言。当数据是非结构化和多语言数据时，处理大量且多样化的数据（例如评论、评分、图像、位置、标签和营业时间）会变得很复杂。Elasticsearch 的混合地理语义搜索（hybrird goe-semantic search）功能通过在单一平台内结合空间数据处理和高级向量文本分析，提供了实用的解决方案。无论你是在搜索地标还是适合家庭的景点，Elasticsearch 都能实现精确而高效的数据检索。

原创 2024-06-19 08:59:37 · 1751 阅读 · 3 评论
搜索与人工智能相结合如何解决企业数据问题？

组织正被数据淹没 —— 从安全事件日志和应用程序错误消息到物联网指标和帮助中心常见问题解答。这些丰富的信息通常存在于孤立的孤岛中，在整合这些信息以提升客户体验、提高运营弹性或降低安全风险方面面临巨大挑战。越来越多的企业发现自己只能存储这些数据或手动缓慢地解析这些数据。组织如何克服分散数据的挑战，转而利用这些数据来获得可操作的见解并解决问题？答案在于范例转变：解决阻碍组织实现所需业务成果的底层数据问题。生成式人工智能和搜索技术的交集体现了这种转变。虽然生成式人工智能带来了强大的计算智能 —— 能够从大

原创 2024-06-18 08:13:33 · 1073 阅读 · 0 评论
Elasticsearch：智能 RAG，获取周围分块（二）

在之前的文章 “Elasticsearch：智能 RAG，获取周围分块（一）” 里，它介绍了如何实现智能 RAG，获取周围分块。在那个文章里有一个 notebook。为了方便在本地部署的开发者能够顺利的运行那里的 notebook。在本篇文章里，我来详述如何进行配置。

原创 2024-06-17 10:38:46 · 1122 阅读 · 0 评论
Elasticsearch：智能 RAG，获取周围分块（一）

在检索增强生成 (RAG) 领域，一个持续存在的挑战是找到输入大型语言模型 (LLM) 的最佳数据量。数据太少会导致响应不足或不准确，而数据太多会导致答案模糊。这种微妙的平衡启发我开发了一个专注于智能分块和利用 Elasticsearch 向量数据库的。

原创 2024-06-13 13:50:50 · 1708 阅读 · 0 评论
使用 Elasticsearch 设计大规模向量搜索

在设计向量搜索体验时，可用选项的数量之多可能会让人感到不知所措。最初，管理少量向量很简单，但随着应用程序的扩展，这很快就会成为瓶颈。在本系列博文中，我们将探讨使用 Elasticsearch 在各种数据集和用例中运行大规模向量搜索的成本和性能。。该数据集包括从集合中的网页中提取的 1.38 亿个段落，使用嵌入到 1024 个维度中。对于这个实验，我们定义了一个可重现的轨道（track），你可以在自己的 Elastic 部署上运行它，以帮助你对自己的高保真密集向量搜索体验进行基准测试。

原创 2024-06-13 11:02:09 · 1833 阅读 · 5 评论
LangChain 与 Elastic 合作为 RAG 添加向量数据库和语义重排序

在过去的一年中，我们看到了生成式人工智能领域的许多进展。许多新服务和库应运而生。LangChain 已成为使用大型语言模型 (LLM) 构建应用程序的最受欢迎的库，例如检索增强生成 (RAG) 系统。该库使原型设计和试验不同的模型和检索系统变得非常容易。为了在 LangChain 中实现对 Elasticsearch 的一流支持，我们最近将我们的集成从社区包提升为官方 LangChain 合作伙伴包。

原创 2024-06-12 12:33:17 · 1125 阅读 · 0 评论
如何在隔离环境中设置 LocalAI 以实现 GPU 驱动的文本嵌入

你是否想在 Elasticsearch 向量数据库之上构建 RAG 应用程序？你是否需要对大量数据使用语义搜索？你是否需要在隔离环境中本地运行？本文将向你展示如何操作。Elasticsearch 提供了多种方法来为你的数据创建嵌入以进行对称搜索。最流行的方法之一是将 E与 OpenAI、Cohere 或 Hugging Face 模型结合使用。这些平台支持许多可以在 GPU 上运行的大型、强大的嵌入模型。但是，第三方嵌入服务不适用于隔离系统，或者对有隐私问题和监管要求的客户不开放。

原创 2024-06-09 09:22:54 · 1032 阅读 · 1 评论
使用 Elasticsearch 调用 OpenAI 函数

OpenAI 中的函数调用是指 AI 模型与外部函数或 API 交互的能力，使它们能够执行文本生成之外的任务。此功能使模型能够通过调用预定义函数来执行代码、从数据库检索信息、与外部服务交互等。该模型根据用户提示智能识别需要调用哪个函数，并使用适当的参数调用该函数。参数也可以由模型动态生成。数据检索：从数据库或 API 访问实时数据。（例如天气信息、股票价格）增强交互：执行需要逻辑和计算的复杂操作（例如，预订航班、安排会议）。与外部系统集成：与外部系统和工具交互（例如，执行脚本、发送电子邮件）。

原创 2024-06-08 12:51:32 · 1052 阅读 · 0 评论
Elasticsearch：检索多向量文档中的原始信息

Elasticsearch（从 8.11 版本及更高版本开始）支持单个字段中每个文档具有多个向量。这样的文档可以通过文档的最相似向量的排名或者通过每个文档具有多个结果（可能在同一结果集中文档包含的每个向量含有一个）来排名。对于密集向量和稀疏向量（例如，使用 ELSER 时）都是如此，但为了简单起见，博客的其余部分将与密集向量相关。

原创 2024-05-14 14:53:36 · 514 阅读 · 2 评论
Elasticsearch：基于多个 kNN 字段对文档进行评分

Elasticsearch 不仅仅是一个词法（文本）搜索引擎。 Elasticsearch 是多功能搜索引擎，除了传统的文本匹配之外，还支持 k 最近邻 (kNN) 搜索以及语义搜索。Elasticsearch 中的 kNN 搜索主要用于查找多维空间中给定点的 “最近邻居”。文档被表示为一组数字（向量），在搜索时，kNN 特征会获取更接近查询向量的相关文档。 kNN 搜索通常应用于涉及向量的场景，其中向量是通过使用深度神经网络的 “嵌入” 过程从文本、图像或音频创建的。

原创 2024-06-02 10:05:49 · 938 阅读 · 0 评论
城市之旅：使用 LLM 和 Elasticsearch 简化地理空间搜索（二）

我们在之前的文章 “城市之旅：使用 LLM 和 Elasticsearch 简化地理空间搜索（一）”，在今天的练习中，我将使用本地部署来做那里面的 Jupyter notebook。

原创 2024-05-31 23:19:19 · 1569 阅读 · 0 评论
城市之旅：使用 LLM 和 Elasticsearch 简化地理空间搜索（一）

探索如何从自然语言提问创建地理空间搜索。在下面的示例中，我们将演示一个请求在地铁站或兴趣点周围一定半径内的 Airbnb 房源列表的问题。你可以将这一日常用例扩展到其他地理空间搜索，例如在指定区域内寻找餐馆、景点、学校和其他地方。我们提供了一本，它将引导你完成设置数据集、将它们导入 Elasticsearch 以及设置生成式 AI 和 LLM 部分的过程。我们还会展示如何使用 Elasticsearch 进行地理空间搜索以及如何结合这两者。

原创 2024-05-30 13:33:22 · 1189 阅读 · 3 评论
使用 retrievers 在 Elasticsearch 中进行语义重新排序

语义重新排序（semantic reranking）是一种方法，它允许我们利用快速检索方法的速度和效率，同时在其上分层语义搜索。它还允许我们立即将语义搜索功能添加到现有的 Elasticsearch 安装中。随着机器学习驱动的语义搜索的进步，我们拥有越来越多的工具可以从数百万个文档中快速找到匹配项。然而，就像为期末考试而临时抱佛脚一样，优化速度意味着要做出一些权衡，而这通常会以准确度的损失为代价。为了抵消这一点，我们看到一些工具在梯度的另一端出现并变得越来越可用。

原创 2024-05-29 15:44:22 · 1229 阅读 · 0 评论
如何使用 Connector API 将数据提取到 Elasticsearch Serverless 中

Elasticsearch 支持一系列摄取方法。其中之一是 Elastic Connectors，它将 SQL 数据库或 SharePoint Online 等外部数据源与 Elasticsearch 索引同步。连接器对于在现有数据之上构建强大的搜索体验特别有用。例如，如果你管理一个电子商务网站，并希望通过跨产品目录的语义搜索来增强客户体验，Elastic Connectors 可以让这一切变得简单。如果你的产品目录存储在 Elastic 支持的。

原创 2024-05-28 15:15:07 · 1326 阅读 · 2 评论