一文读懂神经搜索、Jina 及 Finetuner

文章导读:本文为 Jina AI Co-founder & CTO 王楠,在 2021 年 12 月 25 日 Python Meetup Beijing 的分享实录,内附 Demo 及 PPT 地址。

阅读本文,你将对神经搜索 (Neural Search)、Jina 及 Finetuner,有较为全面的了解。

本文内容概览

神经搜索:用非结构化数据搜索非结构化数据

结构化数据,以常用的数据库为代表,其所有信息都是定义好的,可以直接进行快速搜索。

与结构化数据相对应的,即非结构化数据,这类数据没有直接可供搜索的结构化信息。

常见的非结构化数据包括 PDF 文档、视频、音乐等

​据 MongoDB 统计,我们身边 80%~90% 的数据,都属于非结构化数据。Reference

据 MongoDB 统计,我们身边 80%~90% 的数据,都属于非结构化数据。Reference

所以,非结构化数据的搜索,是一个非常重要的问题。

非结构化数据本身包含丰富的信息,但这些信息必须借助工具抽取和加工。得益于深度学习及人工智能技术的迅猛发展,过去十几年间,产生了很多可以用于抽取非结构化数据信息的深度学习模型。

一方面,各种分类模型可以精确地给视频、照片等非结构化数据打标签;另一方面,还可以利用深度学习模型,把非结构化的数据表示为向量。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值