搜广推
文章平均质量分 86
水的精神
一件事,要么不做,要么做到极致。
展开
-
召回的在线评估与离线评估
本文介绍了召回系统的两种评估方式:离线评估和在线评估。离线评估基于标注数据,通过准确率、召回率、F1-Score 等指标衡量模型效果,适合开发初期的算法调试。在线评估则依赖用户行为,如点击率、转化率和停留时长等指标,能够更真实地反映模型在实际环境中的表现。文章详细探讨了各类评估指标的定义、适用场景及其优缺点,并指出最佳实践是先通过离线评估优化模型,再通过在线评估验证其实际效果。原创 2024-09-23 21:02:36 · 907 阅读 · 0 评论 -
量化在密集向量检索中的权衡:深入分析索引时间、查询效率与召回效果
在现代信息检索系统中,向量搜索已成为提升检索质量和效率的关键技术。随着数据量的激增,如何高效地处理和检索大规模向量数据集,成为了一个重要课题。最近,我在研究一篇关于密集和稀疏检索器的论文——《Operational Advice for Dense and Sparse Retrievers: HNSW, Flat, or Inverted Indexes?》——它为我们提供了关于量化技术在实际应用中的见解。本文将深入探讨量化技术在索引时间、查询效率和召回效果方面的影响。原创 2024-09-17 23:22:32 · 382 阅读 · 0 评论 -
稠密向量检索、稀疏向量检索、BM25检索三者对比
稠密向量检索,也称为Dense Retrieval,是一种基于深度学习的检索方法。它通过将文本转换为高维空间中的连续向量表示,然后使用向量相似度(如余弦相似度)来检索相关文档。这种方法的优势在于能够捕捉到文本的深层次语义信息,从而提高检索的相关性。技术实现:通常使用预训练的语言模型(如BERT、T5)对文档和查询进行编码,得到稠密的向量表示。应用场景:适用于需要理解复杂语义的场景,如自然语言理解、智能问答系统等。性能表现:在小规模数据集上表现优异,但在大规模数据集上可能会遇到性能瓶颈。原创 2024-09-17 22:28:01 · 1145 阅读 · 0 评论 -
RAG 召回提升相关方案分享
最近大半年时间都在做RAG的工作,分享一点个人探索的方向。和提升的方案。文章中会分享是如何做的,以及对应的效果。原创 2024-07-13 15:50:33 · 2311 阅读 · 0 评论 -
搜索引擎中的相关性模型
相关性模型主要关注的是query和doc的相关性。例如给定query,和1000个doc,找到哪个doc是好query最相关的。原创 2024-07-13 13:52:36 · 833 阅读 · 0 评论 -
RAG的上限在哪里?边界在哪里?
随着大模型的火热,RAG也重出江湖,成为AI产品中最火热的成员之一。特别是2024年到现在,越来越多的RAG产品出现在gitlib 上。 世人皆知RAG,唯独不知RAG的能力边界。 RAG用一句话:入门(demo跑通整个流程)像1一样容易,出神入化(能够达到生产级别的要求)真的还挺难。 RAG相关的工作,做了一年又余。随着时间变化,愈来愈觉得,RAG需要特别多的知识才能真的把它做好。而我在不断的补这些知识,这是一条挺难的路。(我自己把它单做“蜀道难”的登山路)原创 2024-07-11 23:57:24 · 1661 阅读 · 0 评论 -
搜索引擎算法工程师,在query理解方面,都有哪些方面的工作
通俗来讲,就是query整形。又可以理解为是一个转接头,把用户送来过来的奇奇怪怪的query(或者说是在搜索引擎看来是奇奇怪怪的query)转换为搜索引擎最想看到的query的。在LLM当前能力的帮助下,实际上query理解的工作好做多了。即使没有太多基础的玩家,实际上完全可以依赖LLM来做这件事。对于任何一个环节,就是一个prompt的事情。这绝对是会有收益的。问题是成本,以及性能。一个检索需求的时延要求多数是3s内,如果只靠LLM是很难控制在3s内的。原创 2024-07-11 23:05:11 · 1441 阅读 · 0 评论 -
使用模型来做召回和排序
文本检索任务可以定义为: 给定一个文档集合,用户输入一个query来表达信息检索需求,借助于一个文本检索系统返回相关文档给用户。日常生活中,我们几乎天天都在用文本检索系统,比如谷歌、百度搜索,淘宝电商搜索,搜索系统已经成为用户获取信息的一个重要入口。对于文本检索任务,抽象出来的核心目标就是怎么去计算用户输入的 query和文档集合中每个doc的文本相似度。原创 2024-05-23 13:27:53 · 1211 阅读 · 2 评论 -
关于搜索引擎链路
搜索引擎的工作流程包括爬虫抓取网页内容、索引处理、查询处理、检索与排名以及结果呈现。在查询处理阶段,搜索引擎需进行多个步骤来优化搜索效果。首先是分词,将查询词分解为独立词汇单元。接着是词权重判别,识别查询中的关键和非关键部分。然后进行类目识别与分类,以提高检索准确性。意图识别也是关键步骤,通过识别查询中的时效性和地域性意图,提升搜索结果的相关性。查询词改写和纠错则帮助改进用户输入,增强搜索匹配度。召回阶段包括关键词召回(如BM25)和语义召回(如DSSM双塔模型),用于匹配相关文档。最后,通过排序模型对召回原创 2024-05-20 00:14:40 · 1219 阅读 · 0 评论 -
一点搜广推的小知识
搜广推,解决的核心问题是信息过载,在海量的数据中,信息中做大海捞针的事情。我自己的真是感受,搜索要分为不同的领域。电商、视频、内容搜索是完全不同的,它们的特征差异很大。知识搜索(或者说问答搜索)又是完全区别于电商和视频的。知识搜索更加关注的是对或者不对,又或者说有或者没有。推荐和搜索的思路是相近的。都是召回,粗排,精排,重拍。通常从粗排就开始使用一些模型了。而模型通常更多的是需要特征的构建。原创 2024-05-19 22:34:51 · 542 阅读 · 0 评论