普通网友-CSDN博客

原创深入解析SAP HANA Cloud Vector Engine及实战应用

SAP HANA Cloud作为一款高性能的内存数据库，现在支持向量存储。向量引擎的引入使得SAP HANA能够高效地处理和查询嵌入式数据，特别是在自然语言处理（NLP）和机器学习相关的应用中大幅提升了处理效率。这种技术的核心是通过存储文档向量化后的结果，允许快速查询相似性和进行复杂数据分析。

2025-01-24 07:20:32 548

原创 Pinecone中的自查询检索器实战解析

在信息检索与人工智能结合的领域，Pinecone作为一款云原生向量数据库，提供了高度可扩展的解决方案。它能存储、搜索和分析高维向量，这对于需要处理大量非结构化数据的应用非常有用。

2025-01-24 07:02:33 386

原创使用LangSmith LLM运行数据进行模型微调

在这篇文章中，我们将介绍如何直接加载LangSmith的LLM运行数据，并基于这些数据微调一个模型。完成这些步骤后，您可以在LangChain应用中使用微调后的模型。

2025-01-24 06:44:13 419

原创使用You.com API进行实时信息检索与查询

You.com API 是一种强大的工具，为开发人员提供了一种将LLM的输出与最新信息结合的方法。这对于处理涉及时间敏感数据的应用程序非常有用，例如新闻、天气和金融信息。

2025-01-24 02:55:31 427

原创使用Passio NutritionAI构建一个营养信息查询代理

Passio NutritionAI 是一个用于获取食品营养成分的API。通过这个API，你可以查询各种食品的热量、蛋白质、脂肪等详细营养信息。这对于构建健康管理应用、智能饮食建议系统等非常有帮助。

2025-01-24 02:14:02 550

原创使用Oracle AI Vector Search生成文档摘要

Oracle AI Vector Search Langchain 库提供了一套用于文档摘要的 API。它支持多个摘要提供者，如数据库、OCIGENAI、HuggingFace 等，允许用户选择最符合其需求的提供者。要使用这些功能，必须按照指定配置摘要参数。详细信息请参考 Oracle AI Vector Search 指南。注意：如果用户希望使用 Oracle 内部和默认提供者“数据库”以外的第三方摘要生成提供者，可能需要设置代理。如果没有代理，请在实例化 OracleSummary 时删除代理参数。

2025-01-24 02:08:23 619

原创从零开始使用Vearch：构建您的向量搜索基础设施

AI应用程序通常需要处理大量的非结构化数据，例如文本、图像和音频，这些数据可以使用深度学习模型转换为向量。向量是数据的数学表示，方便进行相似性搜索。Vearch是一个专门为这种需求设计的向量数据库，它支持高效的向量存储和搜索功能。

2025-01-23 22:10:39 331

原创使用PGVecto.rs进行向量数据库操作

PGVecto.rs是一个为Postgres数据库增加向量搜索能力的工具。它允许你将文档嵌入存储在Postgres数据库中，并使用各种向量相似性度量来进行高效搜索。本文将介绍如何使用PGVecto.rs加载文档，生成和存储嵌入，并进行相似度搜索。

2025-01-23 21:32:10 374

原创使用LLMRails和LangChain进行文档索引和相似性查询

LLMRails是一个API平台，旨在简化生成型AI应用程序的构建，特别是在文档索引和查询方面。LLMRails提供了一种易于使用的API，能够优化性能和准确性，从而帮助开发者高效地管理和查询文档内容。借助LangChain的集成，开发者可以轻松地使用LLMRails的功能进行文档检索、增强生成和相似性搜索。

2025-01-23 20:44:38 421

原创使用Kinetica Vectorstore API进行向量相似度搜索

Kinetica 是一个集成了向量相似度搜索功能的数据库，支持精确和近似最近邻搜索，支持L2距离、内积和余弦距离等多种距离计算方式。在本文中，我们将演示如何使用Kinetica向量存储功能进行向量相似度搜索。

2025-01-23 20:32:55 317

原创如何利用iFixit API实现设备维修信息的自动加载

在互联网的浩瀚信息海洋中，iFixit以其丰富的设备维修信息资源而独树一帜。iFixit是全球最大的在线维修社区，提供了近十万种维修手册和二十万条设备相关的问答信息。通过其开放的API，开发者可以方便地访问这些宝贵的数据资源，用于技术文档的丰富内容补充或设备问答的自动化处理。

2025-01-23 14:50:31 538

原创使用DocusaurusLoader加载和过滤Docusaurus文档

是模块的一部分，专门用于从Docusaurus生成的网站中加载文档。这一工具利用现有的，扫描并加载指定Docusaurus应用程序的所有页面，并将每个页面的主要文档内容返回为一个Document对象。

2025-01-23 13:05:10 443

原创使用LangChain与IBM WatsonxEmbeddings进行文本嵌入

文本嵌入是一种将文本转换成向量的技术，这些向量可以用于各种任务，包括文本分类、相似性搜索以及信息检索。IBM watsonx.ai 的 WatsonxEmbeddings 提供了一种优雅的方式来处理复杂的嵌入任务。

2025-01-23 10:44:37 309

原创使用 Cloudflare Workers AI 加速文本嵌入处理

Cloudflare 是一家著名的 CDN 服务提供商，随着业务的发展，Cloudflare 也逐步涉足云计算、网络安全以及机器学习服务。Cloudflare Workers AI 是一种运行在 Cloudflare 网络上的服务，使我们能够通过 REST API 从代码中调用机器学习模型进行处理。特别是在文本嵌入领域，Cloudflare 提供了多种模型来满足不同的应用需求。

2025-01-23 09:31:25 369

原创使用Petals在本地运行100B+语言模型并结合Langchain

Petals允许用户在本地机器上运行大型语言模型，如BLOOM模型，而无需专用的高性能硬件。这是通过类似BitTorrent的网络架构实现的，即模型参数在分布式网络节点上共享。这种方式不仅降低了硬件门槛，还大大加快了模型下载速度。

2025-01-23 07:15:55 327

原创使用LangChain与Konko完成模型的交互

在现代应用开发中，语言模型的选择和使用是一个关键因素。Konko API通过提供托管的API服务和丰富的模型选择，帮助开发者轻松实现语言模型的集成。本文将重点讲解使用LangChain库中的Konko模块来调用Konko的语言模型进行文本生成的步骤。

2025-01-23 05:45:56 435

原创使用 Javelin AI Gateway 进行大语言模型交互的教程

Javelin AI Gateway 是一个为 AI 应用提供企业级 API 网关的解决方案。它不仅集成了强大的访问安全机制，还提供了对大型语言模型如 OpenAI、Cohere 的统一接口。Javelin AI Gateway 的主要优势在于它能为企业提供访问安全、策略制定和成本控制。

2025-01-23 05:29:10 455

原创使用LangChain与Clarifai模型交互的实战指南

Clarifai为AI开发者提供了丰富的模型和工具，适合进行各类视觉识别、文本分析等任务。与LangChain结合使用，能够极大地简化复杂的AI应用开发流程，使得模型调用更为便捷。

2025-01-23 03:53:16 390

原创使用Arcee类进行文本生成的完整指南

Arcee的领域适应能力使其在医学论文生成、专利内容生成等领域表现出色。在这些应用中，精确的领域知识和高相关性的文本生成能够极大提高效率和成果质量。Arcee允许设置过滤器和结果集大小以辅助文本生成。在使用Arcee之前，请确保已将API密钥设置为环境变量。如果遇到问题欢迎在评论区交流。你也可以直接作为参数传递。

2025-01-23 03:19:20 341

原创在EverlyAI上运行LLM模型——以LLAMA为例

EverlyAI是一个强大的云平台，允许你在云中大规模运行机器学习模型。它还提供了对多种大型语言模型（LLM）的API访问。在这篇文章中，我们将展示如何使用EverlyAI的API来调用LLAMA模型。通过这种方式，你可以在云端轻松地运行和测试你的语言模型。

2025-01-23 00:42:56 631

原创使用 WhyLabs 平台监控数据管道和 ML 应用的实践指南

WhyLabs 是基于开源库whylogs监控数据管道中可能出现的数据质量回退和数据漂移。跟踪机器学习模型的输入、输出和性能退化。提供一种隐私友好的方式，仅上传统计配置文件，而非实际数据。快速启动：使用轻量级的whylogs库生成统计配置文件。集中监控：将配置文件上传到 WhyLabs 平台，设置用于监控和告警的规则。轻松集成：与任何数据管道、ML 框架无缝对接。大数据支持：适配大规模数据(支持批处理和流处理模式)。保护数据隐私：统计信息在本地处理，实际数据不会离开环境。

2025-01-22 20:56:20 879

原创使用 TiDB Serverless 进行向量搜索的 AI 应用开发

TiDB 是一个分布式 SQL 数据库，主要用于大规模数据处理和高并发场景。作为一款兼容 MySQL 协议的数据库，TiDB 允许用户在不牺牲 MySQL 生态系统的情况下，享受分布式数据库的优势。

2025-01-22 19:17:38 337

原创使用John Snow Labs的NLP库进行文本嵌入

John Snow Labs的NLP库是一个全面的软件包，专注于提供高质量的NLP解决方案。其模型库涵盖了多种领域和语言，适合企业级应用场景。通过嵌入文本，你可以为下游任务如语义搜索、文本分类和推荐系统打下良好的基础。

2025-01-22 13:14:12 328

原创集成IBM watsonx.ai与LangChain的实战指南

IBM® watsonx.ai™ 是IBM watsonx™ AI和数据平台的一部分，它将生成式AI能力与传统的机器学习相结合，为用户提供一个强大的AI生命周期管理平台。用户可以通过watsonx.ai轻松地定制和优化模型，以满足企业的数据需求，同时IBM提供了多模型的选择和灵活性。除此之外，watsonx.ai支持混合多云部署，帮助企业实现AI能力的最大化。

2025-01-22 12:14:17 305

原创使用GitPython进行版本控制和代码管理

Git是一种主要用于跟踪项目文件变更的工具，它允许多个开发人员在不同的时间、地点对同一项目进行修改，并合并这些更改。GitPython则是一个Python库，使你能够在Python脚本中执行Git命令，进行仓库管理、分支操作等。

2025-01-22 10:31:52 372

原创使用GeoPandas进行地理空间数据处理的快速指南

GeoPandas是一个开源项目，旨在简化在Python中处理地理空间数据的任务。它通过扩展Pandas的数据类型，使几何类型的空间操作变得可能。GeoPandas的几何操作由Shapely库支持，这使其在处理复杂的地理数据时非常强大。GeoPandas主要设计用于使地理空间数据的处理更加直观和高效。它在Pandas的基础上，加入了对地理数据的支持，使得数据科学家和GIS分析师无需切换工具即可完成复杂的地理空间操作。GeoPandas通过增加对和的支持，扩展了Pandas的功能。这两个核心类允许在Pytho

2025-01-22 10:26:20 445

空空如也

空空如也