自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(84)
  • 收藏
  • 关注

原创 深入解析SAP HANA Cloud Vector Engine及实战应用

SAP HANA Cloud作为一款高性能的内存数据库,现在支持向量存储。向量引擎的引入使得SAP HANA能够高效地处理和查询嵌入式数据,特别是在自然语言处理(NLP)和机器学习相关的应用中大幅提升了处理效率。这种技术的核心是通过存储文档向量化后的结果,允许快速查询相似性和进行复杂数据分析。

2025-01-24 07:20:32 410

原创 Pinecone中的自查询检索器实战解析

在信息检索与人工智能结合的领域,Pinecone作为一款云原生向量数据库,提供了高度可扩展的解决方案。它能存储、搜索和分析高维向量,这对于需要处理大量非结构化数据的应用非常有用。

2025-01-24 07:02:33 290

原创 使用LangSmith LLM运行数据进行模型微调

在这篇文章中,我们将介绍如何直接加载LangSmith的LLM运行数据,并基于这些数据微调一个模型。完成这些步骤后,您可以在LangChain应用中使用微调后的模型。

2025-01-24 06:44:13 306

原创 使用You.com API进行实时信息检索与查询

You.com API 是一种强大的工具,为开发人员提供了一种将LLM的输出与最新信息结合的方法。这对于处理涉及时间敏感数据的应用程序非常有用,例如新闻、天气和金融信息。

2025-01-24 02:55:31 194

原创 使用Passio NutritionAI构建一个营养信息查询代理

Passio NutritionAI 是一个用于获取食品营养成分的API。通过这个API,你可以查询各种食品的热量、蛋白质、脂肪等详细营养信息。这对于构建健康管理应用、智能饮食建议系统等非常有帮助。

2025-01-24 02:14:02 391

原创 使用Oracle AI Vector Search生成文档摘要

Oracle AI Vector Search Langchain 库提供了一套用于文档摘要的 API。它支持多个摘要提供者,如数据库、OCIGENAI、HuggingFace 等,允许用户选择最符合其需求的提供者。要使用这些功能,必须按照指定配置摘要参数。详细信息请参考 Oracle AI Vector Search 指南。注意:如果用户希望使用 Oracle 内部和默认提供者“数据库”以外的第三方摘要生成提供者,可能需要设置代理。如果没有代理,请在实例化 OracleSummary 时删除代理参数。

2025-01-24 02:08:23 550

原创 从零开始使用Vearch:构建您的向量搜索基础设施

AI应用程序通常需要处理大量的非结构化数据,例如文本、图像和音频,这些数据可以使用深度学习模型转换为向量。向量是数据的数学表示,方便进行相似性搜索。Vearch是一个专门为这种需求设计的向量数据库,它支持高效的向量存储和搜索功能。

2025-01-23 22:10:39 264

原创 使用PGVecto.rs进行向量数据库操作

PGVecto.rs是一个为Postgres数据库增加向量搜索能力的工具。它允许你将文档嵌入存储在Postgres数据库中,并使用各种向量相似性度量来进行高效搜索。本文将介绍如何使用PGVecto.rs加载文档,生成和存储嵌入,并进行相似度搜索。

2025-01-23 21:32:10 288

原创 使用LLMRails和LangChain进行文档索引和相似性查询

LLMRails是一个API平台,旨在简化生成型AI应用程序的构建,特别是在文档索引和查询方面。LLMRails提供了一种易于使用的API,能够优化性能和准确性,从而帮助开发者高效地管理和查询文档内容。借助LangChain的集成,开发者可以轻松地使用LLMRails的功能进行文档检索、增强生成和相似性搜索。

2025-01-23 20:44:38 370

原创 使用Kinetica Vectorstore API进行向量相似度搜索

Kinetica 是一个集成了向量相似度搜索功能的数据库,支持精确和近似最近邻搜索,支持L2距离、内积和余弦距离等多种距离计算方式。在本文中,我们将演示如何使用Kinetica向量存储功能进行向量相似度搜索。

2025-01-23 20:32:55 264

原创 如何利用iFixit API实现设备维修信息的自动加载

在互联网的浩瀚信息海洋中,iFixit以其丰富的设备维修信息资源而独树一帜。iFixit是全球最大的在线维修社区,提供了近十万种维修手册和二十万条设备相关的问答信息。通过其开放的API,开发者可以方便地访问这些宝贵的数据资源,用于技术文档的丰富内容补充或设备问答的自动化处理。

2025-01-23 14:50:31 421

原创 使用DocusaurusLoader加载和过滤Docusaurus文档

是模块的一部分,专门用于从Docusaurus生成的网站中加载文档。这一工具利用现有的,扫描并加载指定Docusaurus应用程序的所有页面,并将每个页面的主要文档内容返回为一个Document对象。

2025-01-23 13:05:10 403

原创 使用LangChain与IBM WatsonxEmbeddings进行文本嵌入

文本嵌入是一种将文本转换成向量的技术,这些向量可以用于各种任务,包括文本分类、相似性搜索以及信息检索。IBM watsonx.ai 的 WatsonxEmbeddings 提供了一种优雅的方式来处理复杂的嵌入任务。

2025-01-23 10:44:37 263

原创 使用 Cloudflare Workers AI 加速文本嵌入处理

Cloudflare 是一家著名的 CDN 服务提供商,随着业务的发展,Cloudflare 也逐步涉足云计算、网络安全以及机器学习服务。Cloudflare Workers AI 是一种运行在 Cloudflare 网络上的服务,使我们能够通过 REST API 从代码中调用机器学习模型进行处理。特别是在文本嵌入领域,Cloudflare 提供了多种模型来满足不同的应用需求。

2025-01-23 09:31:25 281

原创 使用Petals在本地运行100B+语言模型并结合Langchain

Petals允许用户在本地机器上运行大型语言模型,如BLOOM模型,而无需专用的高性能硬件。这是通过类似BitTorrent的网络架构实现的,即模型参数在分布式网络节点上共享。这种方式不仅降低了硬件门槛,还大大加快了模型下载速度。

2025-01-23 07:15:55 267

原创 使用LangChain与Konko完成模型的交互

在现代应用开发中,语言模型的选择和使用是一个关键因素。Konko API通过提供托管的API服务和丰富的模型选择,帮助开发者轻松实现语言模型的集成。本文将重点讲解使用LangChain库中的Konko模块来调用Konko的语言模型进行文本生成的步骤。

2025-01-23 05:45:56 368

原创 使用 Javelin AI Gateway 进行大语言模型交互的教程

Javelin AI Gateway 是一个为 AI 应用提供企业级 API 网关的解决方案。它不仅集成了强大的访问安全机制,还提供了对大型语言模型如 OpenAI、Cohere 的统一接口。Javelin AI Gateway 的主要优势在于它能为企业提供访问安全、策略制定和成本控制。

2025-01-23 05:29:10 360

原创 使用LangChain与Clarifai模型交互的实战指南

Clarifai为AI开发者提供了丰富的模型和工具,适合进行各类视觉识别、文本分析等任务。与LangChain结合使用,能够极大地简化复杂的AI应用开发流程,使得模型调用更为便捷。

2025-01-23 03:53:16 350

原创 使用Arcee类进行文本生成的完整指南

Arcee的领域适应能力使其在医学论文生成、专利内容生成等领域表现出色。在这些应用中,精确的领域知识和高相关性的文本生成能够极大提高效率和成果质量。Arcee允许设置过滤器和结果集大小以辅助文本生成。在使用Arcee之前,请确保已将API密钥设置为环境变量。如果遇到问题欢迎在评论区交流。你也可以直接作为参数传递。

2025-01-23 03:19:20 278

原创 在EverlyAI上运行LLM模型——以LLAMA为例

EverlyAI是一个强大的云平台,允许你在云中大规模运行机器学习模型。它还提供了对多种大型语言模型(LLM)的API访问。在这篇文章中,我们将展示如何使用EverlyAI的API来调用LLAMA模型。通过这种方式,你可以在云端轻松地运行和测试你的语言模型。

2025-01-23 00:42:56 544

原创 使用 WhyLabs 平台监控数据管道和 ML 应用的实践指南

WhyLabs 是基于开源库whylogs监控数据管道中可能出现的数据质量回退和数据漂移。跟踪机器学习模型的输入、输出和性能退化。提供一种隐私友好的方式,仅上传统计配置文件,而非实际数据。快速启动:使用轻量级的whylogs库生成统计配置文件。集中监控:将配置文件上传到 WhyLabs 平台,设置用于监控和告警的规则。轻松集成:与任何数据管道、ML 框架无缝对接。大数据支持:适配大规模数据(支持批处理和流处理模式)。保护数据隐私:统计信息在本地处理,实际数据不会离开环境。

2025-01-22 20:56:20 763

原创 使用 TiDB Serverless 进行向量搜索的 AI 应用开发

TiDB 是一个分布式 SQL 数据库,主要用于大规模数据处理和高并发场景。作为一款兼容 MySQL 协议的数据库,TiDB 允许用户在不牺牲 MySQL 生态系统的情况下,享受分布式数据库的优势。

2025-01-22 19:17:38 268

原创 使用John Snow Labs的NLP库进行文本嵌入

John Snow Labs的NLP库是一个全面的软件包,专注于提供高质量的NLP解决方案。其模型库涵盖了多种领域和语言,适合企业级应用场景。通过嵌入文本,你可以为下游任务如语义搜索、文本分类和推荐系统打下良好的基础。

2025-01-22 13:14:12 250

原创 集成IBM watsonx.ai与LangChain的实战指南

IBM® watsonx.ai™ 是IBM watsonx™ AI和数据平台的一部分,它将生成式AI能力与传统的机器学习相结合,为用户提供一个强大的AI生命周期管理平台。用户可以通过watsonx.ai轻松地定制和优化模型,以满足企业的数据需求,同时IBM提供了多模型的选择和灵活性。除此之外,watsonx.ai支持混合多云部署,帮助企业实现AI能力的最大化。

2025-01-22 12:14:17 234

原创 使用GitPython进行版本控制和代码管理

Git是一种主要用于跟踪项目文件变更的工具,它允许多个开发人员在不同的时间、地点对同一项目进行修改,并合并这些更改。GitPython则是一个Python库,使你能够在Python脚本中执行Git命令,进行仓库管理、分支操作等。

2025-01-22 10:31:52 284

原创 使用GeoPandas进行地理空间数据处理的快速指南

GeoPandas是一个开源项目,旨在简化在Python中处理地理空间数据的任务。它通过扩展Pandas的数据类型,使几何类型的空间操作变得可能。GeoPandas的几何操作由Shapely库支持,这使其在处理复杂的地理数据时非常强大。GeoPandas主要设计用于使地理空间数据的处理更加直观和高效。它在Pandas的基础上,加入了对地理数据的支持,使得数据科学家和GIS分析师无需切换工具即可完成复杂的地理空间操作。GeoPandas通过增加对和的支持,扩展了Pandas的功能。这两个核心类允许在Pytho

2025-01-22 10:26:20 345

原创 使用Datadog进行LangChain应用的性能监控

Datadog作为一款全面的监控和分析平台,提供了应用性能监控、日志管理和指标捕获等多种功能。通过将LangChain应用集成到Datadog中,可以帮助开发者获得更详细的性能指标、错误日志等信息,并使监控更加实时和可视化。

2025-01-22 07:56:35 223

原创 使用BiliBili API进行视频数据获取和分析

BiliBili API 提供了一个强大的接口,可以获取平台上大量的视频信息。通过结合Python的bilibili-api-python库,开发者可以便捷地访问BiliBili的视频数据,用于数据分析、用户研究等。

2025-01-22 05:33:32 323

原创 利用Apify和LangChain进行网页数据抓取与载入

Apify是一个功能强大的Web抓取和数据提取云平台,提供了超过上千个可用的Actors,用于不同的抓取、爬取和提取场景。在本文中,我们将介绍如何设置这些Actors并获取数据,用于LangChain中的向量索引。

2025-01-22 03:51:53 304

原创 使用AirtableLoader从Airtable获取数据:实战指南

AirtableLoader是库中的一部分,用于从Airtable中加载数据。这对于构建数据驱动的应用程序尤其有用,因为它可以帮助开发人员轻松地集成Airtable中的数据到他们的Python项目中。

2025-01-22 03:25:03 275

原创 使用AI21SemanticTextSplitter进行语义文本分割的实战指南

AI21SemanticTextSplitter是LangChain中一个强大的工具,旨在通过内容的语义结构来分割文本。不同于传统的按字符或段落分割,它能理解文本的语义并以此为基础进行分割。这使得生成的文本块在语义上更加完整,提高了文本处理的效率。

2025-01-22 02:59:14 400

原创 使用SQL-PGVector进行语义搜索与RAG结合的实战指南

PostgreSQL是一款功能强大的开源关系型数据库管理系统,而pgvector是一个用于存储向量的PostgreSQL扩展,使得PostgreSQL能够支持基于向量的语义搜索。这种结合可以帮助我们更好地处理自然语言数据,特别是在RAG应用场景中,通过结合语言模型(如GPT-3)加强数据库的查询能力。

2025-01-21 23:13:52 492

原创 在Azure上构建RAG应用:使用Azure AI Search与OpenAI模型

在信息检索和问答系统中,RAG(Retrieval-Augmented Generation)是一种结合信息检索和生成式AI模型的技术。此技术通常被用于从大型文档集提取信息并生成自然语言回答。Azure AI Search与OpenAI模型的结合,为开发者提供了一个强大的平台进行RAG应用开发。

2025-01-21 18:30:12 286

原创 使用Python Lint工具提高代码质量

Python是一种动态类型的语言,这虽然提供了很大的灵活性,但同时也可能导致不一致的代码风格和隐藏的类型错误。Lint工具则能够通过自动化的检查帮助开发者保持代码一致性和减少潜在错误。

2025-01-21 18:05:09 296

原创 利用OpenAI构建Neo4j语义层智能代理

语义层的概念是为了在数据结构之上提供一个可以理解用户意图的抽象层。对于图数据库(如Neo4j),这意味着我们可以用自然语言查询数据库,而不需要了解其底层Cypher查询语言。这大大降低了用户的使用门槛,同时提高了数据交互的灵活性。

2025-01-21 16:48:28 289

原创 在Intel® Xeon®可扩展处理器上实现RAG的实战指南

Intel® Xeon®可扩展处理器被广泛用于高性能计算场景,尤其是在AI任务中表现突出。它们内置了加速器,可以在提供最佳安全性的同时,为各种工作负载需求提供前所未有的AI性能。

2025-01-21 15:54:27 833

原创 使用Hugging Face集成实现强大的AI应用

Hugging Face平台以其开源的模型库和简便的接口而闻名,特别在NLP领域拥有广泛的应用。其核心组件包括Hugging Face Hub、模型库、文档加载器和工具等等。这些组件通过等包集成进你的应用中,极大地方便了模型的调用和使用。

2025-01-21 09:15:23 667

原创 使用Google Generative AI和Vertex AI构建智能应用

在现代应用开发中,人工智能(AI)正成为各类产品和服务的核心组件。Google提供的Generative AI和Vertex AI是开发者用于构建智能应用的两大强大平台。Google Generative AI提供了一系列模型,用于生成文本、图像等,而Vertex AI则专注于大规模云端AI服务,支持从模型开发到部署的完整生命周期。

2025-01-21 09:09:54 395

原创 升级到 LangChain v0.2 的详细指南

LangChain 是一个模块化的语言处理框架,广泛用于构建和集成语言模型。v0.2 的发布引入了一些重大变化,旨在提高代码的可维护性和性能。

2025-01-21 07:28:55 414

原创 如何解析XML输出并转换为可用格式

在使用大型语言模型(LLM)时,不同的提供商在输出格式上可能具有不同的优势。虽然JSON是较为常用的格式,但是一些模型在生成XML格式时表现更好,这取决于它们的训练数据。在本文中,我们选用的是Anthropic的Claude-2模型,它在生成XML标签时表现优异。

2025-01-21 03:43:59 301

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除