m3e简介


前言

本文就介绍了大模型基础知识之m3e。


一、m3e是什么?

m3e是一种文本嵌入模型,可以将自然语言转换成稠密向量表示。它支持同质文本相似度计算和异质文本检索等功能。

二、原理

m3e利用对比学习的方式在大规模句对数据集上进行训练,学习将相似的句子映射到向量空间中的相近位置,将不相似的句子映射到远离的位置。对于异质文本检索任务,m3e将查询文本和候选文档分别编码为向量表示,然后计算两个向量的相似度分数(如余弦相似度)。根据相似度分数从候选文档中检索出与查询最相关的文档。m3e使用了指令数据集进行训练,使得在对文本编码时可以遵从指令,提高检索效果。它还支持中英双语的异质文本检索。


参考文献

https://blog.csdn.net/sinat_37574187/article/details/139307542

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值