我们现在一说到大模型,往往说的就是ChatGPT、Llama,或者国产的ChatGLM、文心一言等等。但是,那些大模型一般只属于大厂,对于大部分人来说,我们更多的角色是大模型的使用者,或者是基于大模型来开发应用。
大模型主要应用
目前如果是就文本方面,大模型应用主要聚焦在两类:
-
问答(chat)机器人:这部分目前也是大模型最被人所知的应用,但chat功能我们已经有ChatGPT、Claude、文心一言、通义千问等一众产品可以用,对于大部分人来说,我们是消费者;
-
企业检索应用:企业应用中最常见的就是更高级的检索,我们可以一般叫它检索增强生成(RAG),这个场景在企业本地化应用中比较受欢迎,可以保护企业数据安全,又可以让企业借助AI提升生产效率。
而在企业检索应用中,我相信做过这一块应用的人都会遇到embedding的问题,你的embedding模型会直接影响检索和生成的效率,虽然它不是唯一的影响因素。
主流中文embedding模型
现在主流的中文embedding模型其实也不是太多,以下就是主要的embedding模型了,目前我们用的m3e,但效果感觉还有待提升。排名上看,BGE好像还比较不错。当然,包括像阿里的商用embedding模型也是不错的,1500+维的。