txtai系列教程

txtai系列教程

翻译自 : https://dev.to/neuml/export-and-run-models-with-onnx-fof

本教程系列将涵盖txtai的主要用例,这是一个 AI 驱动的语义搜索平台。该系列的每章都有相关代码,可也可以在colab 中使用。

txtai介绍

txtai执行机器学习工作流来转换数据并构建人工智能驱动的语义搜索应用程序。

传统的搜索系统使用关键字来查找数据。语义搜索应用程序了解自然语言并识别具有相同含义的结果,不一定是相同的关键字。

在最先进的机器学习模型的支持下,数据被转换为用于搜索的向量表示(也称为嵌入)。创新正在快速发生,模型可以理解文档、音频、图像等中的概念。

以下是主要功能

  • 🔎 具有多个索引后端(FaissAnnoyHnswlib)的大规模相似性搜索
  • 📄 为文本片段、文档、音频、图像和视频创建嵌入。支持转换器和词向量。
  • 💡 机器学习管道,用于运行提取式问答、零样本标记、转录、翻译、摘要和文本提取
  • ↪️️ 将管道连接在一起以聚合业务逻辑的工作流。txtai 流程可以是微服务或成熟的索引工作流。
  • 🔗 JavaScript、Java、Rust和Go 的API 绑定
  • ☁️ 使用容器编排系统(例如 Kubernetes)向外扩展的云原生架构

应用范围从相似性搜索到复杂的 NLP 驱动的数据提取以生成结构化数据库。以下应用程序由 txtai 提供支持。

  • paperai - 医学/科学论文的人工智能驱动的文献发现和审查引擎
  • tldrstory - 人工智能驱动的标题和故事文本理解
  • neuspo - 以事实为导向的实时体育赛事和新闻网站
  • codequestion - 直接从终端询问编码问题

txtai 使用 Python 3.6+、Hugging Face TransformersSentence TransformersFastAPI 构建

txtai目录

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

发呆的比目鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值