BCEmbedding: 双语和跨语言嵌入模型

BCEmbedding: 双语和跨语言嵌入模型

BCEmbedding BCEmbedding 项目地址: https://gitcode.com/gh_mirrors/bc/BCEmbedding

项目基础介绍和主要编程语言

BCEmbedding 是由网易有道开源的双语和跨语言嵌入模型项目。该项目主要使用 Python 语言开发,旨在为检索增强生成(RAG)产品提供高效的嵌入和重排序模型。

项目核心功能

BCEmbedding 项目包含两个核心模型:

  1. 嵌入模型(EmbeddingModel):专注于生成语义向量,在语义搜索和问答系统中发挥关键作用。支持中文和英文,未来将支持更多语言。
  2. 重排序模型(RerankerModel):擅长于优化搜索结果和排序任务,支持中文、英文、日文和韩文。该模型能够处理长文本(超过512个token,少于32k个token),并提供有意义的相关性分数,帮助去除低质量的段落。

项目最近更新的功能

  • 2024-02-04:发布技术博客,详细介绍 BCEmbedding 的技术报告。
  • 2024-01-16:增加了对 LangChain 和 LlamaIndex 的集成支持。
  • 2024-01-03:发布了新模型 bce-embedding-base_v1bce-reranker-base_v1
  • 2024-01-03:新增了评估数据集 [CrosslingualMultiDomainsDataset],用于评估 RAG 的性能。
  • 2024-01-03:新增了评估数据集 [Details],用于评估跨语言语义表示的性能。

BCEmbedding BCEmbedding 项目地址: https://gitcode.com/gh_mirrors/bc/BCEmbedding

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

彭诚心Melville

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值