检索原理
句子窗口检索原理
通常在执行基础的RAG
检索时我们会将文档按指定的块大小(chunk_size
)进行切割,然后进行embedding
的向量化处理后存入向量数据库中,在检索时我们会计算用户问题(questio
n) 与文档块的相似度,并选取K个最相似的文档(context
),并将其和用户问题一起发送给LLM
, 并最终由LLM
来生成最终的回复(response
)。那么context
的质量将直接影响到response
的质量,然而context
的质量往往取决于文档块的大小即chunk_size
, 当chunk_siz
e较小时它与question
的匹配度越高,但此时contex
t的信息量就会相对较少,这样也会导致最终的response
质量变差,而当chunk_size
较大时虽然context
的信息量较大,但是contex
t与question
的匹配度就会降低,这也会导致最终的response
质量变差&#x