Machine Learning
文章平均质量分 93
lcwmgecom
搜寻最新科技及设计概念,学习并分享最新AI技术
展开
-
Verba:终极 RAG 引擎 - 语义搜索、嵌入、矢量搜索等!
Verba 一款开源应用程序,旨在为开箱即用的检索增强生成 (RAG) 提供端到端、简化且用户友好的界面。 只需几个简单的步骤,即可在本地通过 HuggingFace 和 Ollama 或通过 OpenAI、Cohere 和 Google 等 LLM 提供商探索您的数据集并轻松提取见解。原创 2024-05-20 13:31:12 · 609 阅读 · 0 评论 -
Cognita:构建生产就绪的应用程序!(开源)
Langchain/LlamaIndex 提供易于使用的抽象,可用于在 Jupyter Notebook 上进行快速实验和原型设计。 但是,当产品投入生产时,会遇到一些限制,例如组件应该是模块化的、易于扩展和扩展。 这就是 Cognita 发挥作用的地方。 Cognita 在底层使用 Langchain/Llamaindex 并为您的代码库提供组织,其中每个 RAG 组件都是模块化、API 驱动且易于扩展的。 Cognita 可以在本地设置中轻松使用,同时为您提供生产就绪环境以及无代码 UI 支持。原创 2024-04-18 06:05:38 · 1295 阅读 · 1 评论 -
隆重推出 Rerank 3:高效企业搜索和检索的新基础模型
今天,将推出最新的基础模型 Rerank 3,该模型旨在增强企业搜索和检索增强生成Retrieval Augmented Generation (RAG) 系统。模型与任何数据库或搜索索引兼容,也可以插入任何具有本机搜索功能的遗留应用程序中。 只需一行代码,Rerank 3 就可以提高搜索性能或降低运行 RAG 应用程序的成本,而对延迟的影响可以忽略不计。具有长上下文的生成模型具有执行 RAG 的能力。 然而,为了优化准确性、延迟和成本,RAG 解决方案需要结合生成模型和我们的 Rerank 模型原创 2024-04-13 02:20:54 · 1268 阅读 · 0 评论 -
如何构建一个个人的 OpenAI 服务器(这样你就可以自动化财务工作)
llama.cpp您是否对 OpenAI 模型的功能着迷,并想尝试创建一个虚假的 OpenAI 服务器用于测试或教育目的?在本指南中,我们将引导您完成使用 llama.cpp 设置模拟 OpenAI 服务器的过程,并提供演示代码片段来帮助您入门。原创 2024-04-12 10:10:49 · 1070 阅读 · 0 评论 -
现已通过Elastic‘s Inference API 提供 Cohere 嵌入
此功能处于技术预览阶段,可能会在未来版本中更改或删除。 Elastic 将努力解决任何问题,但技术预览版中的功能不受官方 GA 功能的支持 SLA 的约束。原创 2024-04-11 21:23:35 · 1041 阅读 · 0 评论