LLM-Embedder

comli_cn

已于 2023-10-27 21:01:24 修改

阅读量1.2k

点赞数

分类专栏： Embedding 文章标签：论文阅读

于 2023-10-27 19:52:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/comli_cn/article/details/134061232

版权

Embedding 专栏收录该内容

12 篇文章 4 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

LLM-Embedder是一个训练目标为支持大语言模型检索增强的统一embedding模型，强调知识、长期上下文、上下文学习和工具学习四个关键能力。模型基于BAAI/bge-base-en，使用多种任务和数据集进行训练，如问答、指令调整、生成等。训练中应用了 Reward from LLM、Instruction-based Fine-Tuning、Homogeneous In-Batch Negative Sampling 和 Stabilized Distillation 等技术，以优化检索增强效果并稳定训练过程。

摘要由CSDN通过智能技术生成

1. 目标

训出一个统一的embedding模型LLM-Embedder，旨在全面支持LLM在各种场景中的检索增强

2. 模型的四个关键检索能力

knowledge：解决knowledge-intensive任务
memory：解决long-context modeling
example：解决in-context learning（上下文学习）
tool：解决tool learning

3. 要解决的问题

嵌入模型必须优化其对LLM的最终检索增强影响，而不是仅仅关注中间检索结果
不同的检索任务旨在捕捉不同的语义关系，它们的影响可能受到相互干扰

4. base model

是在BAAI/bge-base-en的基础上训练的

5. 训练数据

Question Answering
- MSMARCO（labeled）

了解本专栏

超级会员免费看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

comli_cn CSDN认证博客专家 CSDN认证企业博客

码龄7年

128: 原创

1万+: 周排名

7141: 总排名

64万+: 访问

: 等级

4752: 积分

932: 粉丝

749: 获赞

305: 评论

3537: 收藏

私信

关注

热门文章

分类专栏

Embedding 付费 12篇
勇士成长之路
NLP 8篇
大模型
算法 10篇
python 21篇
Rank 4篇
实际项目 4篇
数据分析 12篇
python中常用的包 14篇
工具 8篇
统计学习方法 9篇
git 1篇
C++ 3篇
shell 1篇
大数据 3篇
深度学习相关 12篇
李宏毅深度学习 14篇
Wavelet Tutorial 4篇
Pytorch 3篇
LSTM 3篇
LeetCode 5篇
Qt 1篇
机器学习相关 11篇
Linux 10篇

最新评论

关于Ultraiso一直显示“设备忙”的解决办法
葉秋的Q: 谢谢，OK了。看了你的教程我觉得我好像是傻X。
RetroMAE论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：LM-Cocktail: Resilient Tuning of Language Models via Model Merging
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
神经网络是如何解决异或问题的？
comli_cn: 可以这样理解
神经网络是如何解决异或问题的？
weixin_71815192: 博主，是否可以理解成：第一层包括「与非运算」和「或运算」，第二层就是上一层运算的结果再来进行一次「与运算」，所以这个两层的神经网络其实是不需要激活函数（非线性）的，在平面上相当于画两条线把异或问题解决了？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

comli_cn 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。