大模型应用中大部分人真正需要去关心的核心——Embedding

8 篇文章 20 订阅 ¥9.90 ¥99.00

我们现在一说到大模型,往往说的就是ChatGPT、Llama,或者国产的ChatGLM、文心一言等等。但是,那些大模型一般只属于大厂,对于大部分人来说,我们更多的角色是大模型的使用者,或者是基于大模型来开发应用。

大模型主要应用

目前如果是就文本方面,大模型应用主要聚焦在两类:

  • 问答(chat)机器人:这部分目前也是大模型最被人所知的应用,但chat功能我们已经有ChatGPT、Claude、文心一言、通义千问等一众产品可以用,对于大部分人来说,我们是消费者;

  • 企业检索应用:企业应用中最常见的就是更高级的检索,我们可以一般叫它检索增强生成(RAG),这个场景在企业本地化应用中比较受欢迎,可以保护企业数据安全,又可以让企业借助AI提升生产效率。

而在企业检索应用中,我相信做过这一块应用的人都会遇到embedding的问题,你的embedding模型会直接影响检索和生成的效率,虽然它不是唯一的影响因素。

主流中文embedding模型

现在主流的中文embedding模型其实也不是太多,以下就是主要的embedding模型了,目前我们用的m3e,但效果感觉还有待提升。排名上看,BGE好像还比较不错。当然,包括像阿里的商用embedding模型也是不错的,1500+维的。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值