开箱即用的 Embedding 流水线

Towhee 是一个开源项目,提供开箱即用的 Embedding 流水线,简化非结构化数据如图像、音频、视频的处理。它包含 Pipeline、Operator、Engine、Layers 和 Trainer,支持多种预训练模型,如 resnet、efficientnet 和 VGGish。Towhee 旨在使构建和部署 Embedding 任务变得简单,鼓励用户通过其社区贡献和定制算子。
摘要由CSDN通过智能技术生成

万物皆可 Embedding

“万物皆可 Embedding" 这句话似乎每个做算法模型小伙伴都听过了,那么万物是指什么呢?在大数据的现实世界中,包括了任何内容:图片、视频、语音、文本,甚至3D模型等,这些可统称为非结构化数据。了解了所谓的“万物”,那 Embedding 又指什么?如下图所示,针对非结构化数据,我们利用 AI 技术来对其进行编码,转换成特征向量,通过计算向量实现对非结构化数据的分析。通常将非结构化数据提取向量的过程称为 Embedding。

开箱即用的 Embedding 流水线——Towhee

Embedding 过程通常利用 AI 模型来实现,而模型使用包括调研、选型、训练与调优等复杂且成本较高的流程,好在业界已提供很多预训练好的模型可以直接用,但如何切换模型以及快速上手,就需要一套开箱即用的流水线(Pipeline)。

"X2Vec, Towhee is all you need!" 是 Towhee 这个开源项目的口号,它提供开箱即用的Embedding 流水线,你无需了解内部工作原理,就可以开发和部署各种各样的流水线。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值