- 博客(18)
- 收藏
- 关注
原创 【大模型】RAG相关面试问(持续更新)
多轮对话中,用户意图可能从“获取事实”逐渐转向“深度分析”或“个性化建议”(如从”续航多少"一”适合长途自驾吗”一"对比极氮001哪个更合适”)。传统 RAG的检索仅聚焦事实性文档,难以匹配意图的深层变化,导致回答缺乏针对性。对话主题可能随轮次动态迁移(如从“车型参数”转向“购车优惠”),但传统RAG的检索策略(如固定的向量数据库、检索阈值)是静态的,无法实时调整检索范围或权重,导致检索结果滞后于对话主题变化。1、检索与对话历史脱节,相关性下降(没有考虑多轮对话)5、用户意图的“隐性演进”未被捕捉。
2026-03-03 01:41:40
455
原创 【Dify】dify遇见的问题——绑定本地大模型失败
1、已使用vllm启动了模型Qwen/Qwen2.5-1.5B-Instruct2、相同一台机器中使用docker compose使用默认配置启动了dify3、应用环境为Ubuntu-22.04。
2025-09-03 21:49:59
1661
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1